Возможно ли написать свою антиспам прогу? @ DeForum.ru
DeДверь  
Логин:  
Пароль:  
  Автологин  
   
Разместить рекламу
Письмо админу
Правила | FAQ | *Поиск | Наша команда | Регистрация | Вход
 
 
 Страница 1 из 1 [ Сообщений: 15 ] 
*   Список форумов / Начинка и техника / Программирование для WWW » ответить » создать топик « | »
Автор Сообщение
AlexShop Муж.
участник
34
Сообщения: 1866
Зарегистрирован: 17.02.04
Заголовок сообщения: Возможно ли написать свою антиспам прогу?
Сообщение Добавлено: 23 Ноябрь 2006, 04:12:34 
Используя PHP?
На вопрос а зачем - а так ради хобби, в свободное время. :gent:

Принципы таких программ очень простые:
- программа должна читать письма на сервере, без загрузки на ПЦ
- программа по умолчанию должна скрывать <img> таги и прочую нечисть (фреймы, import и т.д.)
- программа может иметь черный список серверов - откуда спамеры шлют спам.
- программа должна иметь свой приватный черный список (емайлов и ключевых слов) который юзер сам составляет.
- также есть и "белый список"
- юзер может составлять свои фильтры
- программа может слать обратно спамерам сообщения типа - "ошибка указанный е-майл не существует". Причем хорошо это делать в реальном времени (что бы разница во времени была минимальной). Этот способ редко срабатывает потому что роботы шлют спам и они не читают ответы.
- программа должна различать кодировки стран. Если юзер русскоязычный, он может запретить письма на японком, китайском или д.р. чужих языках. Аналогично американцем могут приходить письма на русском.

- программа может определять время когда письмо было послано: если в 3 часа ночи - скорее всего спам.

И самое главное программа должна читать письма и определять что есть спам.

Проще говоря объяснить на примере:
Каждое письму присваивается 100 очков

Если в письме есть слова "Free", "Discount", "Sex" и прочее - то письмо теряет очки.
Если письмо отправлено с запрещенного сервера и в три часа ночи - теряет очки.
Если письмо содержит ваше имя или фамилию - письмо набирает очки.
и т.д.

В конце концов если письмо набрало очков ниже какой то планки - то оно считается спамом.
Корректировать планку может юзер - тем самым определять аккуратнось программы.

Вообщем делюсь идеей, что ничего не стоит.
Интересует по силу ли написать что то такое - что могло бы конкурировать с коммерческими продуктами?

(уже слышу пулеметные очереди) :mrgreen:

P.S.
Юзер должен иметь возможность "обучать" программу что есть спам, а что нет - одной кнопкой.
вот это уже посложнее.

Поддержка общей базы данных (knowledge base), где собирается публичная информация о спаме (от всех юзеров).
MpaK999 Муж.
участник
1
Сообщения: 1716
Зарегистрирован: 14.11.02
Откуда: Ufa/Russia
Сообщение Добавлено: 23 Ноябрь 2006, 06:32:40 
почему бы и нет, пишите, дерзайте :)


AlexShop писал(а):
так ради хобби, в свободное время


как я вам завидую :laugh:

_________________
:: metal kick ass ::
AlexShop Муж.
участник
34
Сообщения: 1866
Зарегистрирован: 17.02.04
Сообщение Добавлено: 23 Ноябрь 2006, 07:13:23 
оффтопик:
ну.. у меня еще идея написать клиент к БД :glasses:
Типа phpmyadmin - только с отменным интерфейсом, с примочками AJAX и прочее
что бы юзерам было приятней пользоватся (и менеджерам кто далек от вэба).
это наверно будет первым проектом (и тут все более менее ясно).
как только начну серьезно готовится - буду рад выслушать пожелания (что хотели бы видеть, а что нет). Выставлю интерфейс в обсуждаловку.


А для спам блокера - тут еще пару диллем есть.

читать письма можно по разному:
- использовать POP3 расширение (http://pecl.php.net/package/POP3)
- использовать IMAP функции.
- либо самому через сокеты (то чего я еще не знаю, но не помешало бы выучить).
- а может к этому времени еще что то появится

------
Ну а начинать надо с маленького:
Хотя бы с простого удобного фраймворка для обработки форм.
Всплывающие окошки (ajax), которые можно передвигать по экрану.
Показать деревовидную структуру+папочки (из данных XML или массива)

такое везде пригодится

Ну я пока холостой, время есть. :)
Вообщем я как один персонаж (забыл) у Гоголя в Мертвых Душах.. мечтаю
ziv Муж.
соучастник
16
Сообщения: 862
Зарегистрирован: 16.04.01
Сообщение Добавлено: 23 Ноябрь 2006, 09:48:19 
AlexShop, главное придумать свой алгоритм.
Вот ведь, живут же люди, а тут выспаться некогда :cry:
MpaK999 Муж.
участник
1
Сообщения: 1716
Зарегистрирован: 14.11.02
Откуда: Ufa/Russia
Сообщение Добавлено: 23 Ноябрь 2006, 11:22:52 
еще в догонку в гугле поищите greylist

_________________
:: metal kick ass ::
Jamakaser Муж.
участник
91
Сообщения: 1163
Зарегистрирован: 26.01.05
Сообщение Добавлено: 23 Ноябрь 2006, 11:59:47 

Цитата:
Возможно ли написать свою антиспам прогу?



Конечно возможно :-)

Кстати, по этому поводу.
Делайте бекапы :-)
Я как-то трехмесячную работу потерял...
Почему вспомнил? Тоже с почтой было связано.

_________________
Найди кликабельный пиксель -->
MIXA Муж.
соучастник
7
Сообщения: 993
Зарегистрирован: 19.09.04
Откуда: Москва
Сообщение Добавлено: 23 Ноябрь 2006, 12:03:43 
У вас есть полгода свободного времени? Ну-ну :cool:
Ainur Муж.
соучастник
16
Сообщения: 731
Зарегистрирован: 15.09.04
Откуда: Italia
Сообщение Добавлено: 23 Ноябрь 2006, 13:18:43 
AlexShop, есть же spamassassin.
AlexShop Муж.
участник
34
Сообщения: 1866
Зарегистрирован: 17.02.04
Сообщение Добавлено: 23 Ноябрь 2006, 17:54:38 

MIXA писал(а):
У вас есть полгода свободного времени? Ну-ну :cool:


не-е это займет больше времени, я может через пол года только начну (если начну) :confused:

Вот тут один чел. сделал www.statcounter.com (видно что на php)
так он 4 года работал в одиночку, и следущие 2 года с чей то помощью!

сейчас он на 30-ти dedicated серверах и 5 работников в команде.
см. http://www.statcounter.com/why_is_it_free.html
но счетчик делать - это ж какие ресурсы железа надо.. :amazed:

вообщем я пока размышляю.
AlexShop Муж.
участник
34
Сообщения: 1866
Зарегистрирован: 17.02.04
Сообщение Добавлено: 23 Ноябрь 2006, 18:47:19 

Jamakaser писал(а):
Кстати, по этому поводу.
Делайте бекапы :-)
Я как-то трехмесячную работу потерял...


сочуствую... бекапы это должно быть как рутина.

Вообще (судя по своему скромному опыту) - начитать какой либо проект, лучше не торопится. Хочу сначала изучить паттерны, посмотреть как народ делает (приглядываюсь к Model-View-Controller).

Потом надо накидать схему (UML) - как это все будет работать. Построить иерархию классов - кто за что отвечает.

Да и есть еще области в которых я не силен :oops: : триггеры и функции в MySQL 5.0 и транзакции. Функции в MySQL должны облегчить задачу и сделают программу более надежной (может даже и более быстрой). Вот тут надо поднатырится..

Я знаю как бывает: напишешь что нибуть, на пол пути остановишься и думаешь что вообще написал :insane: .. после этого хочется вообще все перепиать. :)
вот этого хочется избежать.

Ну а начинать как уже писал - надо с маленьких задач которые потом облегчат большую.
Займусь сначала классом который обрабатывает формы, фильтрует все переменные которые приходят извне, генерирует ошибку - если что то неправильно заполено.


Последний раз редактировалось AlexShop 23 Ноябрь 2006, 19:00:58, всего редактировалось 1 раз.
Acid~Jazz Муж.
соучастник
1
Сообщения: 740
Зарегистрирован: 12.04.03
Откуда: Зеленоград
Сообщение Добавлено: 23 Ноябрь 2006, 18:57:23 
С теми идеями, которые вы озвучили в первом сообщении, - нет, ничего конкурентоспособного сделать нельзя.

_________________
начинающий менеджер . http://acidjazz.photosight.ru/
AlexShop Муж.
участник
34
Сообщения: 1866
Зарегистрирован: 17.02.04
Сообщение Добавлено: 23 Ноябрь 2006, 19:05:10 

Acid~Jazz писал(а):
С теми идеями, которые вы озвучили в первом сообщении, - нет, ничего конкурентоспособного сделать нельзя.


почему?

_________________
Тот, кто задает вопрос, глупец в течение пяти минут, тот, кто его не задает, глупец всю свою жизнь. (Китайская поговорка)
Acid~Jazz Муж.
соучастник
1
Сообщения: 740
Зарегистрирован: 12.04.03
Откуда: Зеленоград
Сообщение Добавлено: 23 Ноябрь 2006, 22:27:23 
AlexShop, это довольно примтивные приемы, с которыми сейчас вряд ли сделаешь что-то вразумительное. Смотреть на "ключевые спамерские слова", искать запрещенные сервера - это самые азы, с которых антиспам начинался много лет назад.

Сейчас все это так далеко ушло вперед что долго просто перечислять все фишки которые реализованы в антиспамерских решениях. Причем анализ одного письма уже вряд ли даст хороший результат, почти везде используется аналитика с больших почтовых серверов, анализ по кодированным цепочкам или как их там, байес и прочая статистическая фигня.

Пользовательские антиспам-приблуды тоже стараются это все использовать, например у Касперского антиспам также обновляет базу, составленную на основе почтового трафика в последние сутки-часы.

Есть одно отличное решение для антиспама, которое несложно реализовать, называется greylisting, "серые списки".

_________________
начинающий менеджер . http://acidjazz.photosight.ru/
MpaK999 Муж.
участник
1
Сообщения: 1716
Зарегистрирован: 14.11.02
Откуда: Ufa/Russia
Сообщение Добавлено: 24 Ноябрь 2006, 09:21:52 
AlexShop, мускул в топку, Постгри или Файрберд

_________________
:: metal kick ass ::
ichik Муж.
соучастник
0
Сообщения: 434
Зарегистрирован: 09.07.06
Сообщение Добавлено: 26 Ноябрь 2006, 15:22:13 
Возможно.
*   Список форумов / Начинка и техника / Программирование для WWW « | » » ответить » создать топик
 Страница 1 из 1 [ Сообщений: 15 ] 
Показать сообщения за:   Поле сортировки  
Найти:
Перейти:  
Уровень доступа: Вы не можете начинать темы. Вы не можете отвечать на сообщения. Вы не можете редактировать свои сообщения. Вы не можете удалять свои сообщения. Вы не можете добавлять вложения.
cron


ООО ДеФорум
При использовании материалов сайта ссылка на DeForum.ru — обязательна.
Проект Павла Батурина ©2001-2077; // Powered by phpBB © 2013 phpBB Group
Rambler's Top100