PDA

View Full Version : Новый алгоритм сможет отсеять почти весь спам


DaNYer
Aug 26, 2004, 18:19
Новый алгоритм для распознавания спама изобретен биологами исследовательского центра TJ Watson в Нью-Йорке, принадлежащего компании IBM. Он основан на методе, который используется учеными для анализа генетических последовательностей, сообщает BBC News.
Работа над алгоритмом, названным "Чунг-Квей" (Chung-Kwei), начались около года назад. Ученые взяли за основу алгоритм "Терезиас" (Teiresias), который был создан для поиска отличающихся ДНК и аминокислот в повторяющихся образцах. Разработчики полагают, что алгоритм может использоваться в различных областях, не только в биологии.

Письма электронной почты воспринимаются алгоритмом "Чунг-Квей" как молекулы ДНК, состоящие из множества символов. Перебирая письмо за письмом, программа накапливает собственную базу последовательностей символов, встречающихся в двух и более письмах. К примеру, слово "Виагра", найденное в нескольких тысячах писем, было внесено в базу шаблонов спама, и в дальнейшем сообщения, содержащие данное слово, будут распознаваться как нежелательные.

При проведении тестовых испытаний на проверку 88 тысяч сообщений программой было потрачено 15 минут, и в 97 процентах случаев алгоритм верно распознал почтовый мусор.

IBM полагает, что алгоритм "Чунг-Квей" станет самым эффективным инструментом против спама. Разработчикам осталось провести некоторые предварительные проверки перед выпуском программы в продажу. По их словам, в работе им очень помог огромный объем спама, который они получают на своем рабочем месте.

URL: http://lenta.ru/internet/2004/08/25/dna/

DaNYer
Aug 26, 2004, 18:21
Chtoto ya ne ponimaiu ajiotaja, ludi dobrie. Obyasnite mne pojaluista, chem naprimer plox algoritm yahoo mail? On mne toje procentov 97 otseivaet..

Aram Hambardzumyan
Aug 27, 2004, 10:05
что меня пугает в этих алгоритмах, так это вероятность (хоть и небольшая) отсеивания нормальных писем... может, у этого алгоритма эта вероятность ниже?

Agregat
Aug 27, 2004, 10:42
обману любой алгоритм на выбор... за деньги.

Ablertus
Aug 27, 2004, 12:57
Да я тоже думал, что таких алгоритмов уже достаточно - по видимому обычная нейронная сеть. На днях кстати моё письмо профессорше оказалось в спам фолдере, так что и получается я обманул :) Вопрос Агрегату: как можно с гарантией обмануть NN?

DaNYer
Aug 27, 2004, 13:05
обману любой алгоритм на выбор... за деньги.

:) da obmanut' ne problema, Vit'. Eto kajdii student sumeet....

No vot kajetsya mne chto za slovami "obman" i "den'gi" kroetsya istinnaya prichina poyavleniya etogo "novogo" algoritma na svet. Tut (v USA) kak Gates pravil'no zametil vse xotyat vsex nakolot' na babki....

Agregat
Aug 27, 2004, 13:10
В общем случае никак. Надо посмотреть алгоритм. Если НС, то просто изучить пороговые функции, если обучается, то как. После этого дело техники.

Ablertus
Aug 27, 2004, 13:14
Есть идея: построить НС, специализирующуюся на обмане других НС :)

Agregat
Aug 27, 2004, 13:19
Хм... тогда в теории она должна суметь обмануть саму себя, что по идее невозможно.:)

Hrach_Techie
Sep 29, 2004, 21:54
Хм... тогда в теории она должна суметь обмануть саму себя, что по идее невозможно.:)
------
logichno :)

nm
Oct 2, 2004, 17:07
ndja .... meenja dostali 20-30 soobshenij w den' , kotorye prosachiwajutsja cherez SpamAssasin .... поставил Mozilla Thunderbird. потренировал 2 дня. получаю удовольствия от просмотра писем с пометкой -- проверено, спама нет :)))

если не доверяете автоматическому алгоритму -- просто пусть помечает спам в инбоксе ... + один фильтр для ручного стирания всех писем помеченных как спам.

Joshua12
Oct 8, 2004, 11:10
Спам вещь хорошая и полезная.

Ektich
Oct 8, 2004, 16:26
Спам вещь хорошая и полезная.

Ektich вытащил свой ПКМБ (http://kalashnikov.guns.ru/models/ka172.html) и направил на Joshua12. "Аааа.." :mod:

DaylightDreamer
Feb 28, 2006, 15:53
А я знаком с таки спамом где используются такие слова как BIAGRA
или V--I--A--G--R--A короче всё что угодно только не Viagra :(