ParserError: Ошибка токенизации данных для csv - PullRequest
1 голос
/ 01 апреля 2020

Я получаю следующую ошибку при попытке загрузить файл csv после удаления нескольких строк в Numbers на Ma c:

ParserError: Ошибка токенизации данных. C ошибка: Ожидается 1 поле в строке 5, пила 2

Чтобы прочитать файл, который я использую

df=pd.read_csv('path/file_name.csv')

Знаете ли вы причину, почему я получаю эту ошибку сообщение? Ряды вроде бы в порядке.

Спасибо

Ответы [ 2 ]

1 голос
/ 01 апреля 2020

Попробуйте: df = pd.read_csv("path/file_name.csv", sep="<separator>", names="<columns>", error_bad_lines=<True/False>) Не могли бы вы написать больше информации?

1 голос
/ 01 апреля 2020

Трудно сказать без подмножества данных, однако вы можете попробовать либо:

  • установить параметр sep, если ваш файл не разделен запятой , (что значение по умолчанию)
  • переключите двигатель на Python, установив параметр engine="python".
df = pd.read_csv('path/file_name.csv', sep=';', engine='python')

Но, возможно, это проблема самого файла и одного или нескольких строки в файле имеют больше полей, чем остальные. В этом случае вы можете избавиться от них, вместо того, чтобы возвращать ошибку, установив error_bad_linesbool в False.

df = pd.read_csv('path/file_name.csv', error_bad_linesbool=False)

Строки со слишком большим количеством полей (например, строка CSV со слишком большим количеством запятых). ) по умолчанию вызовет исключение, и DataFrame не будет возвращен. Если False, то эти «плохие строки» будут удалены из возвращаемого фрейма данных.

- pandas .read_csv

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...