Существующий инструмент или код для идентификации цитируемого текста в электронных письмах - PullRequest
1 голос
/ 30 марта 2009

Я ищу способ идентифицировать цитируемый текст в электронных письмах. Цель состоит в том, чтобы добавить что-то вроде функции «показывать цитируемый текст» в моем веб-приложении, которая включает в себя бот-обработчик почты.

Есть аналогичные вопросы по stackoverflow, но они задают алгоритм. Я мог бы реализовать это, если мне нужно, но я бы предпочел проверенное и верное решение.

Требования:

1) Поддержка электронной почты в формате HTML и обычного текста

2) Работает в полной цепочке (то есть имеет оригинальный текст для сравнения цитируемого текста; не нужно угадывать)

3) Обрабатывает обычные дополнения, связанные с цитатами, такие как «10 мая 2008 года в 6:35 вечера. Брэндон писал:«

Библиотека Python была бы супер волшебным идеалом, но я не ожидаю, что мне повезет. Простой инструмент командной строки, который может сделать это, был бы довольно близок к идеалу, но я не ожидаю, что и так повезет. Я бы с удовольствием остановился на хорошо известной хорошей реализации из почтового клиента с открытым исходным кодом, которую было бы разумно извлечь из инструмента.

У кого-нибудь есть предложения, какой будет моя лучшая ставка?

Я немного удивлен, что не существует такого понятия, как "набор для конструирования ботов для работы с электронной почтой".

Ответы [ 2 ]

2 голосов
/ 21 июля 2010

Просто повторяю письмо, которое я получил по этому вопросу.

В Sup есть довольно простая для понимания / извлечения / перевода часть логики для достижения этой цели. Я перенес соответствующие функции в Python и настроил его для своих целей.

Sup - почтовый клиент на основе терминала, написанный на Ruby: http://sup.rubyforge.org/

0 голосов
/ 19 августа 2015

У Google есть патент на их метод: http://www.google.co.uk/patents/US7222299

...