Регулярное выражение - извлечение всего содержимого из электронного письма, отправленного или отвеченного одним и тем же лицом в цепочке сообщений - PullRequest
0 голосов
/ 02 января 2019

У меня есть набор электронных писем от 3 человек.Я пытаюсь найти способ извлечь все письма, которые были отправлены или отвечены одним из людей.Есть ли способ, которым мы могли бы сделать это с помощью регулярных выражений?

Я пытаюсь сделать это в Python

Ниже приведено, как электронная почта идет:

From: Riefel, Paul [mailto:paul@mail.com]
Sent: Tuesday, September 18, 2018 10:28 AM
To: Waugh, Steve <steve.w@mail.com>, Scott, P <scott.p@abc.com>
Subject: RE: [Sales] Report 

Ok Noted.

_____________________________

From: Scott, P <scott.p@abc.com>
Sent: Tuesday, September 18, 2018 11:28 AM
To: Waugh, Steve <steve.w@mail.com>, Riefel, Paul [mailto:paul@mail.com]
Subject: RE: [Sales] Report 

Hi,

This is a sample weekly sales report.

Предполагаяэта цепочка продолжается еще для нескольких обменов, есть ли способ, которым мы можем извлечь весь текст, отправленный или отвеченный на определенный адрес электронной почты (например, paul@mail.com в данном случае).

1 Ответ

0 голосов
/ 02 января 2019

Что касается содержания письма, это регулярное выражение ниже,

(?s)(?<=\bSubject\b.)([^_]*$)

захватывает весь текст после «Subject:» до первого символа подчеркивания, с которым мы сталкиваемся.

RE: [Продажи] Отчет

Хорошо, Отмечено.

&

RE: [Продажи] Отчет

Привет

Это примерный еженедельный отчет о продажах.

Создать код для Python

Тогда ищите отправителей,

(?<=\bFrom\b.).+

Это может быть более изощренным, но, похоже, в отправителях цепочки писем есть небольшая закономерность, так что сейчас это нужно сделать.

Рифель, Пол [mailto: paul@mail.com]

&

Скотт, P [scott.p@abc.com]

Генерация кода для python

Оба поиска по регулярному выражению должны быть проиндексированы одинаково, то есть вы можете объединить эти два списка (отправитель, контент) и затем фильтровать / манипулировать по своему усмотрению.

Regex Протестировано с использованием regex.101.com

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...