Я ищу способ идентифицировать цитируемый текст в электронных письмах. Цель состоит в том, чтобы добавить что-то вроде функции «показывать цитируемый текст» в моем веб-приложении, которая включает в себя бот-обработчик почты.
Есть аналогичные вопросы по stackoverflow, но они задают алгоритм. Я мог бы реализовать это, если мне нужно, но я бы предпочел проверенное и верное решение.
Требования:
1) Поддержка электронной почты в формате HTML и обычного текста
2) Работает в полной цепочке (то есть имеет оригинальный текст для сравнения цитируемого текста; не нужно угадывать)
3) Обрабатывает обычные дополнения, связанные с цитатами, такие как «10 мая 2008 года в 6:35 вечера. Брэндон писал:«
Библиотека Python была бы супер волшебным идеалом, но я не ожидаю, что мне повезет. Простой инструмент командной строки, который может сделать это, был бы довольно близок к идеалу, но я не ожидаю, что и так повезет. Я бы с удовольствием остановился на хорошо известной хорошей реализации из почтового клиента с открытым исходным кодом, которую было бы разумно извлечь из инструмента.
У кого-нибудь есть предложения, какой будет моя лучшая ставка?
Я немного удивлен, что не существует такого понятия, как "набор для конструирования ботов для работы с электронной почтой".