Приложение Flask IMAP, извлекающее ненужные и неправильные символы - PullRequest
0 голосов
/ 31 декабря 2018

Приложение использует метод get_payload () для получения HTML-сообщения.Проблема состоит в том, что извлеченный HTML состоит из случайных последовательностей \r, \t и \n.По сути, HTML не совпадает между Gmail и моим приложением.

Я внимательно посмотрел на html как из Gmail, так и из моего приложения.В Gmail есть тег <td height="32"></td> и ничего в нем нет, в то время как в моем приложении есть строка из бесполезных символов, как на рисунке ниже.Вместо этих символов в электронном письме просто пробел или ничего.Любая идея, почему я получаю это?

Примечание: это происходит в других электронных письмах, даже с простым электронным письмом с текстом.

enter image description here

Ниже приведен код, который я использую в Python

import email
import email.header
import datetime
import imaplib
import sys
from pprint import pprint

imap_host = 'imap.gmail.com'
imap_user = 'phptest390@gmail.com'
imap_pass = 'Magickey20'

diction = []


def process_mailbox(m):

    rv, data = m.search(None, "ALL")
    if rv != 'OK':
        print('No messages found!')
        return

    for num in data[0].split():
        rv, data = m.fetch(num, '(RFC822)')
        if rv != 'OK':
            print("ERROR getting message", num)
            return

        msg = email.message_from_bytes(data[0][1])
        hdr = email.header.make_header(email.header.decode_header(msg['Subject']))
        subject = str(hdr)
        print('Message %s: %s' % (num, subject))

        # date_tuple = email.utils.parsedate_tz(msg['Date'])
        # if date_tuple:
        #   local_date = datetime.datetime.fromtimestamp(email.utils.mktime_tz(date_tuple))
        #   print('Local Date:', local_date.strftime('%a, %d %b %Y %H:%m:%S'))
        for part in msg.walk():
            if part.get_content_type() == 'text/html':
                # print(part.get_payload(decode=True))
                diction.append({'body': part.get_payload(decode=True)})
    return diction


M = imaplib.IMAP4_SSL('imap.gmail.com')

try:
    rv, data = M.login(imap_user, imap_pass)
except imaplib.IMAP4.error:
    print("LOGIN FAILED!")
    sys.exit(1)

# print(rv, data)

rv, mailboxes = M.list()
if rv == 'OK':
    print('Mailboxes:')
    print(mailboxes)

rv, data = M.select('Inbox')
if rv == 'OK':
    print('Processing mailbox...\n')
    process_mailbox(M)
    M.close()
else:
    print('ERROR: Unable to open mailbox', rv)
    M.logout()

Вот код колбы:

from flask import Flask, render_template, url_for
from forms import RegistrationForm, LoginForm

import email_client


a = email_client.diction

app = Flask(__name__)


@app.route('/test')
def test():
    return render_template('test.html', text=a)


@app.route('/')
@app.route('/email')
def home():
    return render_template('home.html')


@app.route('/about')
def about():
    return render_template('about.html', title='About')


@app.route('/register')
def register():
    form = RegistrationForm()
    return render_template('register.html', title='Register', form=form)


if __name__ == '__main__':
    app.run(debug=True)

И HTML:

{% for t  in text %}
<div class="card content-section">
    <div class="card-body">
        {{ t.body |safe}}
    </div>
</div>
{% endfor %}

Править:

Я добавил импорт разметки и изменил цикл for, который читает тело сообщения, на:

        for part in msg.walk():
        if part.get_content_type() == 'text/html':
            value = Markup(part.get_payload(decode=True))
            print(value)
            diction.append({'body': value})

1 Ответ

0 голосов
/ 01 января 2019

Я нашел решение Actual Result

part.get_payload(decode=True).decode('utf-8')

решит проблему

...