Нет спама, гришь? Павлины, гришь?
Все не так просто, как кажется. Если тебе повезло, то спама нет пока. Однако он может потом появиться. Если же тебе не повезло, то спам фильтруется специальной программой на Яндексе - фильтром спама. Что тоже может оказаться проблемой.
Рассмотрим оба случая.
1) Спама нет (Ложки нет, да?)
Спам рассылается по так называемым базам аддрессов. Базы эти набираются автоматически, специальными программами. Способов несколько, для каждого способа есть способ борьбы:
- Проверяются все возможные е-мейлы в данном домене. Поскольку возможных е-мейлов ООООЧЕНЬ много (при некоторых реализациях протокола теоретически даже счетная бесконечность), проверяются короткие осмысленные буквосочетания, они у программы имеются в специальном словаре. Если на попытку письма на этот е-мейл почтовый сервер не возвращает ругачку, что, мол, нетути такого, мыло заносится в базу.
Способ борьбы - более-менее длинное имя пользователя (то есть то, что до собачки). Для паранойи - еще и неосмысленное. Второе создает затруднения тем, с кем общаешься.
- Собираются все е-мейлы на разнообразных форумах и прочих сайтах. Точнее, собираются все буквосочетания, содержащие собачку. Потом проверяются как в предыдущем пункте. Напоминаю, все автоматически. Да, реально все еще проще, потому как во фразе, к примеру, ЯСпамеровВРотЕ6@л хоть и есть собака, но под синтаксис домена буква "л" явно не подходит, так что это автоматика сразу отсечет.
Способ борьбы - не указывать на форумах в профилях свое мыло (обычно есть галочка "скрывать"), а если форумы такие дурацкие, что мыло в профиле не скрывается, завести ящик только для спама и указывать только его (почту с него можно и не получать, иметь его на том сервере, который лишнюю почту без проблем для владельца ящика автоматически удаляет при переполнении). При указании мыла в тексте, указывать его в виде Тьюрингового теста - разумное существо поймет, автоматика - хрен. Например, nick_yezhoff-sobacka-nkvd-dot-ru. Причем заменять знаки "точка" и "собака" как-нибудь нестандартно (хотя для РАЗУМНОГО СУЩЕСТВА, а не кремниевого вещества все же понятно), потому как проги-мылосборщики стали тоже "умные" (не умные, конечно - программеры ушлые) и могут попробовать какие-то стандартные замены собаки, например [at] или -at- воспринимать как надо. Разумеется, это не очень удобно и людям, которые читают - загадки разгадывать. Кстати, давно уже пора нашему админу тест Тьюринга под названием CAPTCHA поставить при регистрации нового писателя на форуме - ему же меньше будет чистить от спама форум.
- Покупка или покража базы аддрессов. Например, аддрессная книга завирушенной машины. Вирусы сейчас распространяются как раз спамерьем. Аддрессная книга почтовой программы идет на составление базы аддрессов, а сама машина используется для рассылки спама. Все автоматически. Под руководством машины-дирижера. Оркестр, блин. Борьба - не переписываться с теми, кто не умеет защищать свою машину от вирусов. Нереально, поскольку даже у меня, у программиста, много друзей-чайников (у непрограммиста процентный состав чайников среди друзей, очевидно, выше чуть не на порядок). Всех чайников-друзей правилам инфобезопасности все равно не обучишь, да и большинство не хотят понимать безопасность. Пока ценные данные не потеряют или еще как на бабло не попадут. Ну, продажу базы клиентов недобросовестным владельцем почтового сервера мы даже и рассматривать не будем, хотя, как было замечено одним из предыдущих ораторов, спам выгоден провайдерам в случае побайтовой или повременной оплаты. Спам также выгоден бесплатным мейл-серверам, у которых почту смотрят через браузер (инет-эксплорер и им подобные, если среди читателей есть те, кто не знает этого нерусского слова), поскольку каждый просмотр письма - просмотр рекламных объявлений, а они часто проплачиваются не на основе "проплата-за-клик", а на основе "проплата-за-просмотр".
Таким образом, мы видим, что спам рано или поздно появится в ящике инет-пользователя с почти стопроцентной вероятностью. Исключения - ящики, с которых никуда не пишут. У меня, например, есть ящик специально для рассылок Сабскрайба и подобных служб легальных рассылок. Пока не взломают какую-нибудь из этих служб, я могу быть спокоен за этот ящик - больше я его нигде не использую, а имя длинное (хотя и вменяемое) - хрен подберешь.
И что делать? Либо разгребать ручками (я по несколько сотен в день удаляю с рабочего ящика, который открыто указан на моем рабочем сайте), либо фильтровать.
ФИЛЬТРАЦИЯ СПАМА - ОПАСНОСТЬ ПОТЕРИ ПОЧТЫ.
Спам фильтрует машина (реально, конечно, программа, но это в нашем контексте эквипенисуально). Она не ошибается. Разве не так? НЕ ТАК!!! :( Она не допускает невнимательности. А думать, как я уже говорил, не умеет. ВООБЩЕ. Только имитировать мышление. И вот по каким-то критериям (например, фильтрация по формуле условной вероятности имени преподобного Байеса) она отбирает спам. При этом, разумеется, возможны ошибки. Ошибки бывают двух типов (так называемые ошибки первого и второго рода): одна - это когда пропустят чужого, вторая - когда не пропустят своего. Хрен с ним, когда спам пролезет - одно-два письма в месяц не делают погоды (исходя из моих приблизительно десяти тысяч получаемых в месяц спам-сообщений и вероятности такой ошибки у систем порядка 0.01-0.03 процента). Хуже, когда за спам система примет какое-то полезное письмо. Можно потерять клиента. Можно потерять подругу. Если не повезет - потерять чью-то жизнь. Если очень повезет - всего лишь потерять полетный день (может быть актуально для тех, кто без колес). Но потери могут быть неприятными. :(
Почему Яндексу выгодны спам-фильтры? Потому, что без них все уйдут на другой сервер, и доходов от показа рекламы не будет вообще. И потому, что сообщения о прорвавшихся через спам письмах (а там, как я помню, специальная кнопочка есть - сообщить, что это - спам) помогают "обучать" этот самый спам-фильтр (ну, не обучать, конечно, но типа того). В автоматическом же режиме. И потом продавать обученную спамофильтрующую систему большим корпорациям.
До кучи большое количество пользователей яндекс-почты позволяет им предоставлять услуги распознавания спама он-лайн. Одно спам-сообщение присылается неоднократно разным пользователям, и этот цикл - несколько дней. Следовательно, обнаружив, что вот такое-то письмо - спам (по жалобе нескольких пользователей), система остальные такие же (приблизительно такие же, потому как спамеры в каждое письмо добавляют что-то случайное, чтобы ВСЕ письма были разными) просто не примет. Вообще. И если корпоративная система сверяется с Яндексом (за какое-то бабло, и не слишком маленькое), она сможет с большей вероятностью спам фильтровать. А потерянные письма - фигли, поди докажи, что их вообще писали. Это ж не заказное...
От така фигня...