Pandas кодировка немецкий - PullRequest
1 голос
/ 04 марта 2020

Это может звучать как простой вопрос, но я перепробовал все, что нашел в Интернете. Я хочу загрузить CSV в мой pandas кадр данных, чтобы все символы отображались правильно. При загрузке следующим образом:

df = pd.read_csv('round2.csv', sep=';', encoding = "utf-8", engine='python')

Я получаю сообщение об ошибке:

'utf-8' codec can't decode byte 0xe4 in position 3319: invalid continuation byte

При использовании «Latin-1» или «ISO-8859-1» ошибки нет в чтении, но данные отображаются следующим образом

enter image description here enter image description here

Таким образом, у меня одинаковые символы отображаются в двух различные способы в одном и том же файле CSV.

При открытии CSV в Notepad ++ столбцы ('Unternehmen L1, et c.) отображаются правильно, но столбцы (' Anfang L1, et c). ) не Вместо «ä» я получаю «xE4».

Спасибо за помощь.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...