Кодировка символов PyQt4: кодек «ascii» не может кодировать символ - PullRequest
1 голос
/ 24 мая 2011

Попытка использовать следующий скрипт для загрузки страницы, чтобы я мог получить доступ к странице с выполненным javascript.Я хотел бы войти в систему и просмотреть страницу результатов (https://www.thomsononeim.com/v-hom.asp), также с выполненным Javascript. В Python 2.7 я получаю эту ошибку:

Traceback (последний вызов был последним):
Файл "C: / Python27 / Примеры программ / Stupid Test.py", строка 22, в формате html печати UnicodeEncodeError: кодек ascii не может кодировать символ u '\ xa9' в позиции 8273: порядковый номер не находится в диапазоне (128)

Вот код:

from __future__ import unicode_literals
from __future__ import print_function
from __future__ import division
import sys
from PyQt4.QtGui import *
from PyQt4.QtCore import *
from PyQt4.QtWebKit import *


class Render(QWebPage):
    def __init__(self, url):
        self.app = QApplication(sys.argv)
        QWebPage.__init__(self)
        self.loadFinished.connect(self._loadFinished)
        self.mainFrame().load(QUrl(url))
        self.app.exec_()

    def _loadFinished(self, result):
        self.frame = self.mainFrame()
        self.app.quit()

url = 'https://www.thomsononeim.com/s-log_in.asp'
r = Render(url)
html = r.frame.toHtml()
print(html)

1 Ответ

4 голосов
/ 24 мая 2011

Это должно работать:

print(html.toUtf8())
...