У меня есть несколько файлов, которые я пытаюсь загрузить на ноутбуки Jupyter.
Одним из них является файл json, который содержит список слов и был сохранен с кодировкой utf8. Он отлично загружается, используя
encoding = "utf-8-sig"
позже я пытаюсь загрузить csv, который содержит огромный фрейм данных. Я сохранил CSV с использованием кодировки UTF-8, но затем я пытаюсь загрузить его с
encoding = "utf-8"
Я получаю эту ошибку:
UnicodeDecodeError: кодек «utf-8» не может декодировать байт 0xe8 в позиции
12: недопустимый байт продолжения
Я загружаю без ошибок при использовании кодировки latin1
. Но затем, когда я пытаюсь распечатать свой фрейм данных, я получаю много плохих символов Юникода. Если я загружаю один и тот же файл, скажем, в редактор Spyder, я получаю все нужные символы. Есть ли решение этой проблемы?