Создание Web-робота @ DeForum.ru
DeДверь  
Логин:  
Пароль:  
  Автологин  
   
Разместить рекламу
Письмо админу
Правила | FAQ | *Поиск | Наша команда | Регистрация | Вход
 
 
 Страница 1 из 1 [ Сообщений: 20 ] 
*   Список форумов / Начинка и техника / Программирование для WWW » ответить » создать топик « | »
Автор Сообщение
MasMaX Муж.
новый человек
3
Сообщения: 26
Зарегистрирован: 29.10.04
Откуда: Волжск
Заголовок сообщения: Создание Web-робота
Сообщение Добавлено: 22 Апрель 2005, 21:22:27 
Недавно передо мной стала проблема создания так называемого web-робота (или как он правлтно называется). Всё что он должен делать - это переходить по определённым ссылкам на заданном сайте и извлекать из неё определённую информацию. Как это всё реализовать? Точнее на каком языке и какие технологии лучше использовать?
Infinite Муж.
участник
15
Сообщения: 1219
Зарегистрирован: 02.02.05
Сообщение Добавлено: 23 Апрель 2005, 00:11:27 
Да уж. С такой формулировкой вопроса "вставшая проблема" отпадет сама собой чуть позже :) :glasses:
e_moon
новый человек
0
Сообщения: 74
Зарегистрирован: 19.06.02
Откуда: В Киеве
Сообщение Добавлено: 23 Апрель 2005, 02:06:21 
<?php
fopen()
;?>

_________________
Дизайн - это в первую очередь процесс, а макет - подсудимый.
MasMaX Муж.
новый человек
3
Сообщения: 26
Зарегистрирован: 29.10.04
Откуда: Волжск
Сообщение Добавлено: 24 Апрель 2005, 03:00:25 
2 Infinite: Ну может вопрос сформулировал не правильно...


e_moon писал(а):
<?php
fopen()
;?>



И что? Таким способом загружать все страницы по-очереди?
MasMaX Муж.
новый человек
3
Сообщения: 26
Зарегистрирован: 29.10.04
Откуда: Волжск
Сообщение Добавлено: 24 Апрель 2005, 03:36:07 
А по-правде это реально написать на рнр? Чтобы ссылки анализировал и переходил по ним.
Чебурген
соучастник
3
Сообщения: 315
Зарегистрирован: 29.08.04
Сообщение Добавлено: 24 Апрель 2005, 09:04:12 
реально, но так никто не делает.
Это всё равно, что на комбайне, который пшеницу убирает, возить муку в город на базар.
Теоретически можно, но на практике односельчане будут на тебя смотреть, как на идиота.
Inviz Муж.
соучастник
0
Сообщения: 687
Зарегистрирован: 05.04.05
Сообщение Добавлено: 24 Апрель 2005, 17:17:34 
Смотря какой сложности анализ.
Если просто извлекать инфу, то я писал такой на пхп много раз, а если анализ будет сложным и информации тонны - тогда пхп тут будет не в тему имхо
Ainur Муж.
соучастник
16
Сообщения: 731
Зарегистрирован: 15.09.04
Откуда: Italia
Сообщение Добавлено: 24 Апрель 2005, 22:05:08 
Inviz, Имеешь в виду что не потянет PHP?

Я знаю только один поисковик написанный на PHP, правда итальянский.
http://www.outseek.net - бррр жуткий сайт :)
MasMaX Муж.
новый человек
3
Сообщения: 26
Зарегистрирован: 29.10.04
Откуда: Волжск
Сообщение Добавлено: 25 Апрель 2005, 01:01:53 

Inviz писал(а):
Смотря какой сложности анализ.
Если просто извлекать инфу, то я писал такой на пхп много раз, а если анализ будет сложным и информации тонны - тогда пхп тут будет не в тему имхо


Анализа как такого практически и нет. Просто переход по ссылкам и сбор на нужной странице определенной информации. Адреса страниц в приципе примерно одинаковы.
bE(o0L Муж.
постоянный участник
23
Сообщения: 3311
Зарегистрирован: 22.07.03
Откуда: сзабугра
Сообщение Добавлено: 25 Апрель 2005, 01:28:10 
а зачем тебе просто так бегать по ссылкам? на пхп можно конечно выдрать все href`ы из хтмла и посадить сервер, переберая их (или не посадить) тока смысл? щётщик накрутить? :cool:
какая у тебя задача стоит?

_________________
можно на ТЫ.
MMiket Муж.
соучастник
15
Сообщения: 405
Зарегистрирован: 14.08.02
Откуда: Kiev
Сообщение Добавлено: 25 Апрель 2005, 15:23:59 
Сбор информации вида mailto: и отправка по собранным адресам спама :killanasshole:
Бaзиль Муж.
участник
49
Сообщения: 1288
Зарегистрирован: 13.02.05
Откуда: Околомосковье
Сообщение Добавлено: 26 Апрель 2005, 10:23:57 
на C++.
хотя можно и на Ассемблере ;)

_________________
Не кочегары мы, не плотники,
Но сожалений горьких нет -
Как нет?
А мы дизайнеры-художники,
И с высоты вам шлем привет -
Привет!
MasMaX Муж.
новый человек
3
Сообщения: 26
Зарегистрирован: 29.10.04
Откуда: Волжск
Сообщение Добавлено: 28 Апрель 2005, 04:34:21 
Нет спамом я не увлекаюсь. Задача такая:
1. зайти на страничку. там будет 10 нужных ссылок
2. перейти по эти сслыкам поочереди
3. прейти ещё "вглубь" и сохранить определенную инфу - рисунок и текст. текст примерно повторятся. у рисонка тоже адресс примерно одинаков.
4. сохранить эту инфу и картинку с каждой из 10 страничек в один html файл.
5. перейти к следующим 10 ссылкам.

Надеюсь теперь более-менее понятно?
Inviz Муж.
соучастник
0
Сообщения: 687
Зарегистрирован: 05.04.05
Сообщение Добавлено: 29 Апрель 2005, 13:20:40 
ну например вот http://personart.ru/temp/news
Обновляет новости с Compulenta.ru (ходит по ссылкам) и складвыает в HTML файл - http://t72.ru/~inviz/news

пхп.
MasMaX Муж.
новый человек
3
Сообщения: 26
Зарегистрирован: 29.10.04
Откуда: Волжск
Сообщение Добавлено: 3 Май 2005, 00:57:31 

Inviz писал(а):
ну например вот http://personart.ru/temp/news
Обновляет новости с Compulenta.ru (ходит по ссылкам) и складвыает в HTML файл - http://t72.ru/~inviz/news

пхп.



а исходные коды нигде нельзя посмотреть? :lamer:
Inviz Муж.
соучастник
0
Сообщения: 687
Зарегистрирован: 05.04.05
Сообщение Добавлено: 4 Май 2005, 18:09:15 
постучи в асю 23 23 825
или в мыло isoso@mail.ru
haslett
новый человек
0
Сообщения: 4
Зарегистрирован: 12.04.05
Сообщение Добавлено: 12 Май 2005, 14:30:57 
Не очень понимаю какая разница на чем делать? Основная нагрузка приходится все равно на fopen/fread
Нет?
Акела Муж.
Констататор
17
Сообщения: 7419
Зарегистрирован: 15.11.04
Сообщение Добавлено: 12 Май 2005, 14:32:11 
haslett, разница в скорости и производительности.
sts
новый человек
0
Сообщения: 105
Зарегистрирован: 10.12.01
Откуда: Город-Герой Лондон
Сообщение Добавлено: 14 Май 2005, 06:02:48 
как вариант:
есть множество програм - проверяльсчиков ссылок которые делают уже пол-работы
я использовал ЛинкЛинт для всех нужд.
возми и добавь свою функциональность
Акела Муж.
Констататор
17
Сообщения: 7419
Зарегистрирован: 15.11.04
Сообщение Добавлено: 14 Май 2005, 06:06:36 
оффтопик:
Йоооооооооооооптыть. RTFM!!!
*   Список форумов / Начинка и техника / Программирование для WWW « | » » ответить » создать топик
 Страница 1 из 1 [ Сообщений: 20 ] 
Показать сообщения за:   Поле сортировки  
Найти:
Перейти:  
Уровень доступа: Вы не можете начинать темы. Вы не можете отвечать на сообщения. Вы не можете редактировать свои сообщения. Вы не можете удалять свои сообщения. Вы не можете добавлять вложения.
cron


ООО ДеФорум
При использовании материалов сайта ссылка на DeForum.ru — обязательна.
Проект Павла Батурина ©2001-2077; // Powered by phpBB © 2013 phpBB Group
Rambler's Top100