Как прочитать PDF-вложение из электронной почты в Python - PullRequest
0 голосов
/ 16 марта 2019

Я пытаюсь извлечь прикрепление Pdf из моего электронного письма и пытаюсь его распечатать, но это дает мне очень плохие результаты. Есть ли способ извлечь из него только текст и цифры?Вот мой код

import imaplib
import email
import os
import io

svdir = 'P:\\'

mail = imaplib.IMAP4_SSL('imap.gmail.com',993)
mail.login("example@gmail.com", "examplepassword")
mail.select("Inbox")

typ, msgs = mail.search(None, '(SUBJECT "samplepdf")')
msgs = msgs[0].split()
print(msgs)

for emailid in msgs:
    resp, data = mail.fetch(emailid, "(RFC822)")

email_body = data[0][1]
m = email.message_from_bytes(email_body)

if m.get_content_maintype() != 'multipart':
    continue

for part in m.walk():
    if part.get_content_maintype() == 'multipart':
        continue
    if part.get('Content-Disposition') is None:
        continue

    filename = part.get_filename()
    fg=part.get_payload(decode=True)
    print(fg)

Мне жаль, что я не могу опубликовать вывод здесь, потому что он очень длинный, и я даже не могу скопировать его, потому что это делает мой компьютер запаздывающим.

Заранее спасибо.

1 Ответ

0 голосов
/ 16 марта 2019

Python не имеет встроенных пакетов для чтения PDF-файлов. Вам нужно будет использовать библиотеку парсинга PDF, например https://pypi.org/project/PyPDF2/.

Надеюсь, это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...