|
Можно долго стучать
себя в грудь и говорить про уникальность нашего продукта, про
использование невиданных доселе и суперэффективных методиках
фильтрации и бороться за последние 4-5 процентов от 100% угадывания
«спам»/«не спам» умалчивая про ложные
срабатывания. Так вот, ничего этого не будет. Методики, которые мы
применяем для фильтрации спама, самые обычные, проверенные и
надежные. Очевидно, что «надежность» и есть ключевое
слово при выборе продукта. Мы прекрасно понимаем, что
экспериментировать на пользователях опрометчиво и экспериментов не
будет тоже.
Чтобы лучше понимать
происходящее, начнем с концептуальных принципов, вокруг которых и
строится SM AntiSpam:
Каковы приоритеты SM AntiSpam?
Письма
«пользователь – пользователь» (P2P)
имеют наивысшую ценность.
Далее следуют
легальные рассылки, на которые подписался пользователь, периодика -
их приоритет несколько ниже.
Всё остальное –
спам, нелегальная почта, от которой мы пытаемся оградить
пользователя.
Это что касается
классификации почтовой корреспонденции по уровню приоритетов.
Теперь о самих
принципах работы SM AntiSpam:
В SM
AntiSpam используются как стандартные и
устойчивые к ложным срабатываниям методы, так и методы фильтрации,
пришедшие к нам из радиофизики, которые тоже очень надежны.
Как работает
SM AntiSpam?
К первым методам
относятся чёрные/белые списки, определение корректности IP
и т.п. Тут мы просто постарались сделать всё красиво и удобно.
Ко вторым, в частности,
относится информационный аналог дифференциального каскада, принцип
работы которого известен более 50 лет (наверное, много больше).
Применение этого принципа - наша заслуга, по крайней мере, мы нигде
не читали о подобном.
Итак, проводим
аналогии:
Входящий поток писем
(ВП(t)) – это сигнал
Пользовательский поток
писем (ПП(t)) – это полезный сигнал
Спам (СП(t))
– это шум, помехи
Сигнал:
ВП(t)
= ПП(t) + СП(t)
Дифференциальный каскад
состоит из приемника сигнала и приёмника шума, затем из входящего
сигнала вычитается шум и остается только полезный сигнал:
ВП(t)
= ПП(t) + СП(t)
ПП(t)
= ВП(t) - СП(t) =
ПП(t) + СП(t) -
СП(t)
В нашем случае
приемником сигнала служит любой ящик, на который точно не должно
приходить корреспонденции, спамоуловитель. Любая почта, пришедшая на
него – спам. Затем эти письма сравниваются с входящей
корреспонденцией пользователей и если на ящик пользователя пришло
письмо аналогичное письму на спамоуловителе, оно определяется как
спам.
Разумеется, мы
сравниваем письма как положено – шинглы, хеш-функции, всё это
успешно применяется. Этот метод хорош тем, что, во-первых, он
булевский, а во-вторых, если вдруг на ваш серевер совершена успешная
атака и спамерам стали доступны адреса пользователей, в число этих
адресов попадет и спамоуловитель и это значит, что очередная
спам-атака будет отбита. Более того, когда спамеры будут
обмениваться адресами, ящик спамоуловителя получит еще большее
распространения и вместо усиления спам потока вы, со временем,
получите его уменьшение. Это напоминает использование силы противника
против самого противника в айкидо, не правда ли?
Юзабилити?
Мы четко сознаем, что
среди пользователей SM AntiSpam
будет мало фанатов, для которых поковыряться в настройках, помучиться
при инсталляции и обучении программы – это творчество и
удовольствие. Большинство наших потребителей – сисадмины, у
которых работы хватает и «хорошо» для них – это
когда софт ставится легко, легко настраивается, работает стабильно,
юзеры довольны, спам перестает быть для них остронегативным фактором,
в общем, инсталлировал SM AntiSpam
и забыл о проблеме. Это и называется хорошим юзабилити.
Исходя из этих
предпосылок, мы и строили SM AntiSpam.
Продукт получился в меру простым, дружелюбным к пользователю,
надежным, быстрым и нересурсоёмким. Надеемся, что он получит широкое
распространение, а мы, со своей стороны, постараемся обеспечить его
дальнейшую эволюцию.
СКАЧАТЬ
12.12.2005
|