Нахождение «плохих адресов электронной почты» в почтовом ящике - PullRequest
1 голос
/ 14 декабря 2010

У меня есть программный доступ к почтовому ящику POP3 плюс доступ к архивным письмам, хранящимся в базе данных. Моя цель - найти неправильные адреса электронной почты - адреса электронной почты, с которых сообщения были возвращены (отклонены) со статусом или сообщениями, такими как:

  • Не доставленная почта
  • Уведомление о состоянии доставки (сбой)
  • Недоставленная почта вернулась отправителю
  • Электронные письма от таких людей, как почтовый демон или почтмейстер

Есть ли способ отфильтровывать такие письма без использования "эвристики"? Легко отсканировать тему на наличие слов, таких как «невозможность доставки» или отправителей, таких как «mailer-daemon», но я хочу лучшего решения, если оно есть.

Обратите внимание, что у меня есть доступ к заголовкам почты для всех архивированных писем POP3 / базы данных. Есть ли какой-нибудь заголовок, который я могу использовать?

1 Ответ

1 голос
/ 01 февраля 2011

Некоторые почтовые серверы реализуют RFC 3464 . Те, которые это делают, обычно генерируют уведомления о статусе доставки с заголовком сообщения Content-Type из multipart / report и трех составных частей (text / plain, message / delivery-status и message / rfc822). Таким образом, вы можете обнаружить эти характеристики сообщения и обработать его соответствующим образом. Сообщение обычно будет выглядеть так:

От: «Система доставки почты»
Тема: Уведомление о статусе доставки (отказ)
Content-Type: multipart / report; отчет типа = доставка-статус

Тип содержимого: текст / обычный
Удобное для восприятия объяснение уведомления о состоянии доставки.

Тип содержимого: сообщение / статус доставки
Структурированная машиночитаемая причина для уведомления о состоянии доставки.

Тип содержимого: message / rfc822
Исходное сообщение.

Для тех почтовых серверов, которые генерируют уведомления о состоянии доставки в неструктурированном формате, вероятно, все еще необходимо обнаруживать их уведомления, анализируя текст заголовков сообщений From: и Subject:

...