Перл и Поисковые Системы... @ DeForum.ru
DeДверь  
Логин:  
Пароль:  
  Автологин  
   
Разместить рекламу
Письмо админу
Правила | FAQ | *Поиск | Наша команда | Регистрация | Вход
 
 
 Страница 1 из 1 [ Сообщений: 16 ] 
*   Список форумов / Начинка и техника / Программирование для WWW » ответить » создать топик « | »
Автор Сообщение
Proof
новый человек
0
Сообщения: 79
Зарегистрирован: 14.01.02
Заголовок сообщения: Перл и Поисковые Системы...
Сообщение Добавлено: 1 Июнь 2003, 23:26:24 
Сейчас пишу движок для сайта на Перле и возник вопрос.… Мне нужно, что-бы поисковые системы (Rambler, Yandex, Yahoo, Google, и т.д.) могли сканировать мой сайт и успешно его обрабатывать.… Т.к. в данный момент все делается ручками и *.shtml страницами, то посковики все находят, но вот надоело уже все ручками, да ручками...
Так же, к теме, есть форум (YaBB) на Перле и поисковики его прекрасно сканируют, но мне не понятно почему...
Мой движок будет выводить каталог продуктов на страницу и всякие другие прибамбасы.… Работать он будет по похожему приципу, как и форум (вся информация хранится в *.txt файлах)….
Теперь вопрос.… Что я должен сделать, чтобы поисковые системы могли нормально сканировать мой скрипт на информацию?
phantomas
новый человек
3
Сообщения: 195
Зарегистрирован: 23.11.02
Откуда: Москва
Сообщение Добавлено: 2 Июнь 2003, 10:03:10 
Это зависит от правил работы каждого поисковика конкретно, которые как правило ими публикуются.
А в целом кажется ничего необычного нет, все тоже самое (meta тэги, описание, заголовки и текст страниц)
phantomas
новый человек
3
Сообщения: 195
Зарегистрирован: 23.11.02
Откуда: Москва
Сообщение Добавлено: 2 Июнь 2003, 10:06:03 
Например вот что поэтому поводу говорит Yandex (http://www.yandex.ru/info/webmaster7.html)
Proof
новый человек
0
Сообщения: 79
Зарегистрирован: 14.01.02
Сообщение Добавлено: 2 Июнь 2003, 10:28:13 
phantomas,
У меня один вообще не индексируется.… Как поисковики обрабатывают скрипты? Выполняют или тупо их читают? Мне не понятно, почему мой форум сканируется Яндексом, а скрипт каталога - нет.… Ведь они используют практически одну и ту же структуру.…
Proof
новый человек
0
Сообщения: 79
Зарегистрирован: 14.01.02
Сообщение Добавлено: 2 Июнь 2003, 10:29:04 
Правила тоже читал... И на Яндексе, и на Рамблере, но ответа так и не нашел...
phantomas
новый человек
3
Сообщения: 195
Зарегистрирован: 23.11.02
Откуда: Москва
Сообщение Добавлено: 2 Июнь 2003, 10:48:15 
Надо бы пообщаться с разработчиками, все-таки есть там какая-то особеность
Crazy Муж.
Модератор
107
Сообщения: 14561
Зарегистрирован: 23.12.01
Откуда: Moscow
Сообщение Добавлено: 2 Июнь 2003, 10:57:26 

Proof писал(а):
phantomas,
Как поисковики обрабатывают скрипты? Выполняют или тупо их читают?



А как ты себе представляешь механизм "тупого чтения" серверного скрипта? :)
DoG
новый человек
0
Сообщения: 32
Зарегистрирован: 02.05.02
Откуда: Санкт-Петербург
Сообщение Добавлено: 2 Июнь 2003, 12:41:21 
Гугл прекрасно индексирует динамические страницы, правда тока на один уровень. :) Дальше за деньги.

Превращение длинного и кривого урла в удобоваримый для спайдеров и людей - стандартная задача mod_rewrite апача.
Yura
новый человек
0
Сообщения: 9
Зарегистрирован: 24.05.03
Сообщение Добавлено: 3 Июнь 2003, 00:09:44 
на www.sitemaker.ru есть доходчивая статья про mod_rewrite...

Насчет "тупо читать" - этого они не могут, как и любые посетители сайта, поисковики ходят по ссылкам и получают html-код как и все остальные...

Насчет гугля не знаю, вроде бы он не очень любит динамику и ссылки на динамические страницы должны быть прямые, а так в глубь какого-нить форума больше он не полезет (хотя может я и ошибаюсь)

Яндекс хавает все, весь форум переиндексит, да еще и по несколько копий страниц (так как разные урлы ил-за сессий)…

Хотя рамблер и апорт в хелпах пишут (по крайней мере писали), что не индексят динамику, сейчас в ответ на запрос совершенно нормально вываливаются ссылки с & ? ; = и прочее...

Но лучше с мод_рерайтом поиграть, тем более это не так сложно...

_________________
ё=моё
Crazy Муж.
Модератор
107
Сообщения: 14561
Зарегистрирован: 23.12.01
Откуда: Moscow
Сообщение Добавлено: 3 Июнь 2003, 00:31:29 

Yura писал(а):
Насчет гугля не знаю, вроде бы он не очень любит динамику и ссылки на динамические страницы должны быть прямые, а так в глубь какого-нить форума больше он не полезет (хотя может я и ошибаюсь)



Когда я последний раз за ним наблюдал -- лез до упора.
Proof
новый человек
0
Сообщения: 79
Зарегистрирован: 14.01.02
Сообщение Добавлено: 3 Июнь 2003, 03:11:41 

Yura писал(а):
на www.sitemaker.ru есть доходчивая статья про mod_rewrite...

Но лучше с мод_рерайтом поиграть, тем более это не так сложно...



Спасибо... Прям самое оно...
Proof
новый человек
0
Сообщения: 79
Зарегистрирован: 14.01.02
Сообщение Добавлено: 3 Июнь 2003, 09:26:23 
Прошу прощения за небольшой оффтоп, но есть загвоздка с .htaccess и mod-rewrite.…

Вот мой .htaccess:
Код:
Options -Indexes
ErrorDocument 404 http://www.my_server.ru/404.shtml
RewriteEngine on
Options +FollowSymlinks
RewriteBase /
RewriteRule ^robots.txt$ /cgi/robots.cgi?%{REQUEST_URI}
RewriteCond % {HTTP_USER_AGENT} ^EmailSiphon [NC, OR]
RewriteCond % {HTTP_USER_AGENT} ^ExtractorPro
RewriteRule ^.*$ - [F]


Но при таком раскладе сервер выдает 500 ошибку, ссылаясь на неправильный флаг в RewriteCond (RewriteCond: bad flag delimiters)….

В чем проблема?

P.S. Обязательно что-то проглядел.… :)
ptitov
новый человек
0
Сообщения: 175
Зарегистрирован: 22.07.02
Откуда: Москва
Сообщение Добавлено: 3 Июнь 2003, 21:24:29 
А что вы пытаетесь сделать?
RewriteRule ^robots.txt$ /cgi/robots.cgi?%{REQUEST_URI} зачем?
Зачем RewriteCond?

_________________
Иногда хостер
Proof
новый человек
0
Сообщения: 79
Зарегистрирован: 14.01.02
Сообщение Добавлено: 4 Июнь 2003, 00:28:38 
ptitov,
RewriteRule ^robots.txt$ /cgi/robots.cgi?%{REQUEST_URI} по другому поводу и работает прекрасно...

Проблема состоит в
RewriteCond % {HTTP_USER_AGENT} ^EmailSiphon [NC, OR]
RewriteCond % {HTTP_USER_AGENT} ^ExtractorPro
RewriteRule ^.*$ - [F]
Wartex Муж.
Злой Дух
9
Сообщения: 1774
Зарегистрирован: 06.10.01
Откуда: Halifax, Canada
Сообщение Добавлено: 5 Июнь 2003, 09:43:33 
оффтопик:

_________________
Digital Reality Crew
Proof
новый человек
0
Сообщения: 79
Зарегистрирован: 14.01.02
Сообщение Добавлено: 5 Июнь 2003, 09:59:12 
оффтопик:
Wartex,
Нет уж... Мне туда не надо... :)
*   Список форумов / Начинка и техника / Программирование для WWW « | » » ответить » создать топик
 Страница 1 из 1 [ Сообщений: 16 ] 
Показать сообщения за:   Поле сортировки  
Найти:
Перейти:  
Уровень доступа: Вы не можете начинать темы. Вы не можете отвечать на сообщения. Вы не можете редактировать свои сообщения. Вы не можете удалять свои сообщения. Вы не можете добавлять вложения.
cron


ООО ДеФорум
При использовании материалов сайта ссылка на DeForum.ru — обязательна.
Проект Павла Батурина ©2001-2077; // Powered by phpBB © 2013 phpBB Group
Rambler's Top100