Python Pandas читает символы UTF-8 - PullRequest
0 голосов
/ 07 сентября 2018

Я пытаюсь прочитать файл Excel, содержащий шведские символы åäö.

Я импортирую файл Excel с pd.read_excel (путь, имя листа, кодировка = 'utf8')

Прекрасно работает, чтобы импортировать его, и я вижу символы åäö, но когда я работаю с данными, например, создаю новую переменную df ['East'] = df ['Öst'] + 50, я получаю сообщение об ошибке Кодек Ascii не может декодировать байт 0xc3 в позиции 33: порядковый номер не в диапазоне

Кто-нибудь, кто может помочь мне решить эту проблему?

Ответы [ 2 ]

0 голосов
/ 07 сентября 2018

Дважды проверьте, сохранен ли Excel как UTF-8

В Excel 2016 При сохранении как: нажмите Дополнительные параметры> Инструменты> Параметры веб-интерфейса> Кодировка> Сохранить этот документ как ... (выберите UTF-8 из списка)

Сохранение Excel как csv или даже txt также помогает во многих случаях. Если csv или txt, экспортированные из Excel, также не открываются / работают неправильно откройте его в блокноте и снова сохраните, выбрав правильную кодировку UTF-8

0 голосов
/ 07 сентября 2018

Дважды проверьте установленную версию Pandas.
В документации Pandas 0.23.4 read_excel этот параметр не упоминается.

Что вы можете попробовать: экспортировать файл Excel в CSV и прочитать его через read_csv, который поддерживает параметр-кодировку .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...