Unicode проблемы с ноутбуками Jupyter - PullRequest
1 голос
/ 19 апреля 2019

У меня есть несколько файлов, которые я пытаюсь загрузить на ноутбуки Jupyter. Одним из них является файл json, который содержит список слов и был сохранен с кодировкой utf8. Он отлично загружается, используя

encoding = "utf-8-sig"

позже я пытаюсь загрузить csv, который содержит огромный фрейм данных. Я сохранил CSV с использованием кодировки UTF-8, но затем я пытаюсь загрузить его с

encoding = "utf-8"

Я получаю эту ошибку:

UnicodeDecodeError: кодек «utf-8» не может декодировать байт 0xe8 в позиции 12: недопустимый байт продолжения

Я загружаю без ошибок при использовании кодировки latin1. Но затем, когда я пытаюсь распечатать свой фрейм данных, я получаю много плохих символов Юникода. Если я загружаю один и тот же файл, скажем, в редактор Spyder, я получаю все нужные символы. Есть ли решение этой проблемы?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...