Кодировать вывод Scrapy, чтобы разрешить французские буквы - PullRequest
0 голосов
/ 12 мая 2019

У меня есть скрипт Scrapy, который анализирует с французского сайта. Я использую команду scrapy runspider test.py -o test2.csv, чтобы получить вывод. Вывод не отображает неанглийские буквы, такие как «Premium Sécurité de tuyau.» Как изменить настройки или item кодировка значений словаря для отображения имени, как показано. Посетите amazon french для примера французских символов, которые я должен разобрать.

Если я использую:

response.xpath('//*[@id="productTitle"]/text()').extract_first().strip().encode("utf-8").decode("ascii","ignore")

Я получаю "Gardena 8169-30 Premium Sécurité de tuyau d'arrosage 19 mm (1,9 cm (0,75")) "

Я проверил этот вопрос о кодировке scrapy , но я думаю, что это для python2 (я использую python3). По сути, я ищу имя, которое отображается на сайте.

1 Ответ

1 голос
/ 12 мая 2019

Вам необходимо импортировать из CSV вручную в Excel и выбрать кодировку UTF-8.

Можно ли принудительно заставить Excel автоматически распознавать файлы UTF-8 CSV?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...