Нет четкого способа отличить рассылку от персонализированных рассылок. В отличие от спама, большинство массовых писем запрашивается / ожидается, поэтому отправитель не делает странных вещей, чтобы обойти фильтры спама, что означает, что эти письма часто смешиваются довольно хорошо.
Однако есть некоторые тенденции, которые вы можете искать. Если вы хотите сделать это надежно, вам, вероятно, потребуется применить некоторую систему оценки, как это делают спам-фильтры.
Вам также нужно будет признать, что вы обязаны получать значительную долю ложных срабатываний и ложных отрицаний.
Некоторые вещи, которые характерны для массовых рассылок и которые встречаются реже в личной переписке:
- Адреса «Кому» и «Копия» не содержат локального получателя. Иногда отправитель отправляет на адрес «mailList@mydomain.com» вместо «receientA@recipientAdomain.com», «receientB@recipientBdomain.com» и т. Д. В этих случаях также вероятно, что в «Кому» отображается только один адрес. и ничего не появляется в "Cc"
- Адрес «От» - это «noreply @», «newsletter @», «do-not-reply @», «mailinglist @», еще менее распространенные термины, такие как «support @» или «sales @» (но помните, они могут вызвать ложные срабатывания)
- Наличие заголовка " List-Unsubscribe: "
- Сообщение содержит ссылку для отмены подписки. Запустите поиск по шаблону, чтобы найти общие фразы в последних нескольких строках письма. Ищите ссылки или такие слова, как «отписаться», «отказаться» и т. Д.
- Списки рассылки обычно имеют богатый контент. Проверьте интенсивное использование CSS и большого количества изображений, все сообщение содержится в структуре
<table></table>
или <ul><li></li></ul>
. то есть, что-то вроде Dreamweaver, а не почтовый клиент.
- Заголовки или жирный контент в верхней части сообщения. Если первый фрагмент сообщения напоминает новостную рассылку, это, вероятно, новостная рассылка.
- Много ссылок или частые ссылки на одни и те же (или те же несколько) веб-сайтов. Информационные бюллетени будут пытаться направить пользователя на сайт (ы) компании, насколько это возможно. Вы можете получить еще более высокую оценку, если связанный домен совпадает (или напоминает) домен отправителя.
- Тяжелые ссылки на социальные сети. Если это новостная рассылка, содержащая несколько статей, каждая история может иметь собственную ссылку «Tweet this», «Like this». Персональные пользователи могут содержать (не более) одну ссылку на Twitter, Facebook и т. Д. (В своей подписи)
- Уведомления и другие автоматически сгенерированные сообщения часто будут иметь одинаковый базовый формат. Если у вас есть возможности, запустите какое-то сравнение или сравнение с предыдущими сообщениями. Сильное совпадение подразумевает автоматизацию.
- Нет приветствия или общего приветствия. Однако личные письма часто пропускают бит «Дорогой Фред», так что само по себе это не достаточно хорошее обнаружение; но такие вещи, как «Уважаемый пользователь» или «Уважаемый клиент», почти наверняка являются общими.
- Маловероятно, чтобы закончить в "С уважением, Ян" или "С уважением, Джон Доу"
- Отправитель ранее набрал высокие баллы. Вести протокол. Если отправитель вызывает высокий балл несколько раз, это почти наверняка массовая рассылка.