Файл .csv возвращает «ошибку Unicode», когда я пытаюсь импортировать в Python - PullRequest
0 голосов
/ 08 мая 2019

Я пытаюсь импортировать файл набора данных .csv, используя панды на ноутбуке Jupyter.Я продолжаю получать одно и то же сообщение об ошибке Unicode decode

, которое я пробовал с (r'file name') и без него, с удвоением обратной косой черты, а также с использованием прямой косой черты

это мой код

import pandas as pd
df = pd.read_csv(r'C:\users\justanotheregg\Downloads\medals.csv')

это часть того, что я получаю

UnicodeDecodeError                        Traceback (most recent call last)
pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._convert_tokens()

pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._convert_with_dtype()

pandas/_libs/parsers.pyx in pandas._libs.parsers.TextReader._string_convert()

pandas/_libs/parsers.pyx in pandas._libs.parsers._string_box_utf8()

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x92 in position 12: invalid start byte

During handling of the above exception, another exception occurred:

1 Ответ

0 голосов
/ 08 мая 2019

Ваш CSV-файл, по-видимому, не в формате UTF-8 , но именно этого ожидает функция по умолчанию. Вам необходимо выяснить, в какой кодировке находится файл (если это экспорт в Excel, это, вероятно, 'cp-1252'; другие вероятные кодировки из семейства ISO-8859 не имеют сопоставления для 0x92, где он закрывающая одинарная кавычка в 1252, очень часто встречающаяся в тексте, написанном в MS Office), и передают свое имя в качестве необязательного параметра кодирования .

...