парсинг таблиц в электронных письмах outlook * .msg от python - PullRequest
0 голосов
/ 30 мая 2018

Я пытаюсь читать outlook * .msg, используя python и Pandas.Я получил тело письма, используя модуль «ExtractMsg».Письма содержат очень сложную таблицу, поскольку в некоторых ячейках есть новые жесткие строки ('\ r \ n').Это делает преобразование в Панд очень непредсказуемым.Мне интересно, как я мог воспроизвести те же таблицы в Пандах.Большое спасибо!

Как прикреплено письмо: скриншот электронной почты

enter image description here

мой код здесь:

import ExtractMsg
email = ExtractMsg.Message(file)
email_body = email.body

Тело письма выглядит так:

'\ r \ nA \ r \ nB \ r \ nC \ r \ n1 \ r \ n1a \ r \ n1b \ r \ nss \ r \N1c \ г \ п2 \ г \ n \ г \ N \ г \ n \ г \ n3 \ г \ N \ г \ N \ г \ n \ г \ nxxx \ г \ n4 \ г \ N4A \ г \ n4b \r \ n4c \ r \ n5 \ r \ n5a \ r \ nttt \ r \ n5b \ r \ n5c \ r \ n \ r \ n '

...