Python, lxml и - PullRequest
       33

Python, lxml и

0 голосов
/ 20 февраля 2012

Я использую lxml, чтобы получить строку с веб-страницы. Что мне нужно сделать, чтобы получить строку данных, которые я извлекаю, не имея ошибки ниже? Я думаю, я просто не могу использовать str() для решения проблемы.

В питоне:

mystring = MySQLdb.escape_string(i.text_content())


(<type 'exceptions.UnicodeEncodeError'>, UnicodeEncodeError('ascii', u"\n\nEve Pownall\n\n  \n    \n    \n    \n        Eve Pownall\n\t  (Author)\n\t\n        \u203a Visit Amazon's Eve Pownall Page\n        Find all the books, read about the author, and more.\n\n         See search results for this author  \n        Are you an author?\n        Learn about Author Central\n        \n      \n   \n  \n\n  \n      amznJQ.onReady('bylinePopover', function () {});\n  \n\n\n (Author)\n\n\n\n\n\n\n\n\n\n\n", 75, 76, 'ordinal not in range(128)'), <traceback object at 0x7f225c99f050>)

1 Ответ

0 голосов
/ 20 февраля 2012

Вам необходимо явно кодировать строку в хорошо известной кодировке (скорее всего, UTF-8).

Дополнительная информация:

http://collective -docs.readthedocs.org / ru / latest / устранение неисправностей / unicode.html

...