Извлечение текста из вложений в файлы .MSG, хранящиеся на диске - PullRequest
0 голосов
/ 19 июня 2019

Я использовал модуль mailparser в python3 для извлечения вложений в файлы .EML (код показан ниже)

import mailparser
mail = mailparser.parse_from_file(filepath)
msg_body = mail.body.split('--- mail_boundary ---', 1)[0]
msg_subject = mail.subject
msg_attachments = mail.attachments
print(msg_subject)

Я не могу использовать приведенный выше код для файлов .MSG. Это не работает. Есть ли лучший способ сделать это? Я пробовал extract_msg, email_parser, но не повезло.

1 Ответ

0 голосов
/ 19 июня 2019

Если вы используете пакет mail-parser в списке с одним пипи, то в соответствии с их документацией необходимо установить пакет libemail-outlook-message-perl вместе с пакетом mail-parser.

Вкл.Debian:

apt-get install libemail-outlook-message-perl

Для получения подробной информации вы можете сделать (при условии, что у вас установлен Debian OS):

apt-cache show libemail-outlook-message-perl

Вы можете найти загрузки для других пакетов здесь .

Этот является их хранилищем github.

Если у вас есть windows, то быстрое решение - преобразовать файлы .msg в файлы .eml, используя такие сайты, как * 1022.* это .Другой вариант - вручную собрать пакет из их репозитория github.

...