read_csv не открывает файл .csv; вместо этого нужно использовать csv.reader + defaultdict для синтаксического анализа в кадре - PullRequest
2 голосов
/ 29 мая 2020

Я пытаюсь открыть csv-файл 50 лучших песен Kaggle Spotify с помощью pd.read_csv, но он дает ошибку ниже: «Код 'utf-8' c не может декодировать байт 0xf1 в позиции 2: недопустимый байт продолжения»

В Excel это выглядит как обычный CSV-файл. Я попытался использовать метод csv.reader, и я смог открыть его, используя defaultdict и несколько циклов for. Почему не работает pd.read_csv?

ссылка на CSV-файл Kaggle для удобства: https://www.kaggle.com/leonardopena/top50spotify2019

1 Ответ

1 голос
/ 30 мая 2020

Установка кодировки latin-1:

import pandas as pd

df = pd.read_csv('datasets_456958_861311_top50contry.csv',
                 encoding='latin-1'
                 )

print(df.head())

Вывод:

   Unnamed: 0                            title          artist  ...  spch  pop country
0           1                     Dance Monkey     Tones and I  ...   9.0  100   world
1           2                          ROXANNE  Arizona Zervas  ...  15.0   99   world
2           3                         Memories        Maroon 5  ...   5.0   99   world
3           4                          Circles     Post Malone  ...   4.0   99   world
4           5  All I Want for Christmas Is You    Mariah Carey  ...   4.0   98   world

[5 rows x 17 columns]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...