UnicodeDecodeError: кодек «utf-8» не может декодировать байт 0xc9 в позиции 388: недопустимый байт продолжения - PullRequest
2 голосов
/ 16 октября 2019

Я действительно начинаю на python, но я часами в этой строке, не могу никуда уйти, не починив его.

cadastro_2019_10= pd.read_csv("inf_cadastral_fi_20191015.csv",delimiter=";")[["CNPJ_FUNDO","DENOM_SOCIAL","CLASSE"]]

UnicodeDecodeError: кодек «utf-8» не может декодировать байт 0xc9 в позиции 49: недопустимый байт продолжения

cadastro_2019_10= pd.read_csv("inf_cadastral_fi_20191015.csv",delimiter=";")[["CNPJ_FUNDO","DENOM_SOCIAL","CLASSE"]]

еще раз:

UnicodeDecodeError: кодек «utf-8» не может декодировать байт 0xc9 в позиции 388: недопустимый байт продолжения

Ответы [ 2 ]

0 голосов
/ 17 октября 2019

Я обнаружил, что должен был добавить: encoding = 'cp1252', но спасибо за ваше время

0 голосов
/ 16 октября 2019

Выясните, какую кодировку использует CSV-файл. Кажется, он не использует UTF-8. Скажем, это латиница 1, тогда вы можете попробовать набрать read_csv(..., encoding="latin1").

Если вы работаете в системе UNIX, вы можете использовать команду file, чтобы попытаться определить кодировку.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...