Проблема Scrapy с международным текстом - PullRequest
1 голос
/ 25 августа 2011

Я сделал соскоб текста с веб-страницы с помощью скрапа.В пауке у меня есть такой код:

title = hxs.select("//h1/text()").extract() #1
final_text = title[0].encode('utf-8')   #2

Здесь проблема в том, что строка № 1 дает [u'Puerto Ban \ xfas '], строка № 2 дает Puerto Ban \ xc3 \ xbas

Нооригинальный текст был Пуэрто Банус .Как мне сохранить и отобразить этот оригинал?

1 Ответ

1 голос
/ 25 августа 2011
>>> print u'Puerto Ban\xfas'
Puerto Banús
>>> print 'Puerto Ban\xc3\xbas'
Puerto Banús

Я не вижу здесь проблемы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...