Получить только текстовый / обычный раздел электронного письма, полученного с помощью imaplib в Python - PullRequest
0 голосов
/ 10 ноября 2019

Я пытаюсь получить только часть text/plain письма, полученного с помощью imaplib на Python:

#!/usr/bin/env python

import imaplib
import sys
from pprint import pprint

from email.parser import HeaderParser
from email.header import decode_header

reload(sys)
sys.setdefaultencoding("utf-8")

conn = imaplib.IMAP4_SSL('host')
conn.login('username', 'password')
#conn.select('Inbox', readonly=True)
conn.select('Inbox')
a, b = conn.search(None, '(UNSEEN)')

if b[0]:
        c = b[0]
        d = c.split()
        e = d[-1]

        #(BODY[HEADER.FIELDS (SUBJECT FROM)])
        data = conn.fetch(e,'(BODY[1] BODY[HEADER.FIELDS (SUBJECT FROM)])')
        #pprint(data)

        body_data = data[1][0][1]
        header_data = data[1][1][1]
        #print(body_data)


#      parser = HeaderParser()
#      msg = parser.parsestr(header_data)
#
#      print (decode_header(msg['From'])[0][0].decode('utf-8') + ": " + decode_header(msg['Subject'])[0][0].decode('utf-8'))

В случае составного сообщения, что я получаю в результате "body_data"как тело сообщения со всеми разделами.

Я пробовал на примере здесь :

raw_message = data[0][1]
msg = email.message_from_string(raw_message)
for part in msg.walk():
    # each part is a either non-multipart, or another multipart message
    # that contains further parts... Message is organized like a tree
    if part.get_content_type() == 'text/plain':
        print part.get_payload() # prints the raw text

Однако, по некоторым причинам, part.get_payload() возвращает толькоодин символ из текста.

Я вынужден использовать Python 2.7.13.

1 Ответ

1 голос
/ 10 ноября 2019

Мне удалось получить то, что я хочу, изменив BODY[1] на BODY[1.1] в команде fetch:

#!/usr/bin/env python

import imaplib
import sys

from email.parser import HeaderParser
from email.header import decode_header

reload(sys)
sys.setdefaultencoding("utf-8")

conn = imaplib.IMAP4_SSL('host')
conn.login('username', 'password')
#conn.select('Inbox', readonly=True)
conn.select('Inbox')
a, b = conn.search(None, '(UNSEEN)')

if b[0]:
        c = b[0]
        d = c.split()
        e = d[-1]

        data = conn.fetch(e,'(BODY[1.1] BODY[HEADER.FIELDS (SUBJECT FROM)])')

        body_data = data[1][0][1]
        header_data = data[1][1][1]
        print(body_data) #Now "body_data" always contains the body, i.e. only the "text/plain" section

...
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...