Pandas.read_csv Ошибка «неожиданный конец данных» - PullRequest
0 голосов
/ 31 августа 2018

Я пытаюсь прочитать набор данных с помощью pd.read_csv (), получаю ошибку. Excel может открыть его просто отлично.

reviews = pd.read_csv('br.csv') выдает ошибку ParserError: Ошибка токенизации данных. Ошибка C: EOF внутри строки, начинающейся со строки 312074

reviews = pd.read_csv('br.csv', engine='python', encoding='utf-8') возвращает ParserError: неожиданный конец данных

Что я могу сделать, чтобы это исправить?

Edit: Это набор данных - https://www.kaggle.com/gnanesh/goodreads-book-reviews

1 Ответ

0 голосов
/ 23 октября 2018

Для меня это исправлено:

error_bad_lines=False

Это просто пропускает последнюю строку. Так что вместо

reviews = pd.read_csv('br.csv', engine='python', encoding='utf-8')

reviews = pd.read_csv('br.csv', engine='python', encoding='utf-8', error_bad_lines=False)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...