Pandas: UnicodeDecodeError: код 'utf-8' c не может декодировать байты в позиции 0-1: недопустимый байт продолжения - PullRequest
0 голосов
/ 17 апреля 2020

сообщество. Я хочу открыть CSV с помощью pandas и выполнить анализ на нем. Пожалуйста, помогите, так как я не могу открыть сам CSV. Я попытался открыть его в кодировке UTF-8, Latin-1 и ISO-8859-1. Это не сработало. КОД:

csv_file3='COVID-19-geographic-disbtribution-worldwide.csv'
with open(csv_file3,'rt')as f:
    data = csv.reader(f)
    j=0
    for row in data:
         j+=1

ОШИБКА:

Traceback (most recent call last):
  File "analysisofcases.py", line 87, in <module>
    for row in data:
  File "/usr/lib/python3.6/codecs.py", line 321, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 15-16: invalid continuation byte

Это CSV, который я хочу открыть. Это мой код и ошибка при запуске кода. ** Пожалуйста, проверьте и посмотрите, в чем проблема **

1 Ответ

0 голосов
/ 17 апреля 2020

Попробуйте, проверьте также стандартные кодировки .

data = pd.read_csv("COVID-19-geographic-disbtribution-worldwide.csv", encoding = 'unicode_escape', engine ='python')
...