Мне нужно проанализировать файл электронной почты в elmx (формат файла электронной почты Mac OS X), чтобы извлечь некоторую информацию с помощью регулярного выражения с Python
Письмо содержит следующий формат, и до и после него много текста.
...
Name and Address (multi line)
Delivery estimate: SOMEDATE
BOOKNAME
AUTHOR and PRICE
SELLER
...
Пример выглядит следующим образом.
...
Engineer1
31500 N. Mopac Circle.
Company, Building A, 3K.A01
Dallas, TX 78759
United States
Delivery estimate: February 3, 2011
1 "Writing Compilers and Interpreters"
Ronald Mak; Paperback; $21.80
Sold by: Textbooksrus LLC
...
Как я могу разобрать письмо, чтобы извлечь их? Обычно я использую line = file.readline(); for line in lines
, но в этом случае некоторая информация является многострочной (например, адрес).
Дело в том, что эта информация является лишь частью большого файла, поэтому мне нужно найти способ их обнаружить.