У меня есть следующая строка:
This is the most recent email of this thread
More text
From: a@a.com
Date: 13 August, 2018
More text...
From: a@a.com
Sent: Tuesday 23 July
To: b@b.com, c@c.com
Subject: Test
Мне нужно извлечь все до этой комбинации строк:
From: *
Sent: *
To: *
Subject: *
*
действует как подстановочный знак.
Таким образом, мой результат должен быть:
This is the most recent email of this thread
More text
From: a@a.com
Date: 13 August, 2018
More text...
Я хочу отфильтровать это с помощью регулярного выражения, но я не могу понять это. Есть указатели?
Это шаблон регулярного выражения, который я пробовал в regex101, но он почему-то не работает в моем скрипте python: r"([\w\W\n]+?)\n((?:from:[^\n]+)\n+((?:\s*sent:[^\n]+)\n+(?:\s*to:[^\n]+)\n*(?:\s*cc:[^\n]+)*\n*(?:\s*bcc:[^\n]+)*\n*(?:\s*subject:[^\n]+)*))"
Спасибо!