Методы извлечения подписи из электронной почты - PullRequest
0 голосов
/ 25 мая 2018

Я хотел бы извлечь подписи электронной почты из фрейма данных Pandas с одним столбцом, где каждая строка содержит дискретное сообщение электронной почты в виде строки.Некоторые электронные письма в кодировке HTML, а некоторые нет.Они могут быть любого провайдера электронной почты (например, Gmail, Microsoft, Yahoo и т. Д.).

Я знаю, что подписи Gmail содержатся в div, где class="email_signature", что упрощает их синтаксический анализ.Моя дилемма заключается в следующем: каков наилучший способ извлечения подписей, не относящихся к электронной почте?Есть ли регулярное выражение, которое захватывает содержание электронной почты?Как я могу применить это регулярное выражение к фрейму данных Pandas в Python?

Я приведу пример, но данные являются частными и, честно говоря, я не думаю, что это необходимо для этого вопроса.

1 Ответ

0 голосов
/ 29 мая 2018

Оформить заказ SigParser.com.Это API для этого.Он использует подписи электронной почты для извлечения контактных данных.Это то, что вы ищете?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...