проблема при чтении CSV-файла продуктов с pandas python - PullRequest
0 голосов
/ 18 июня 2020

У меня есть CSV-файл продуктов, и я пытаюсь прочитать этот файл с помощью pandas python, но получаю эту ошибку

мой код

import pandas as pd
df = pd.read_csv('D:\\work\\amazon\\move_in_links\\final.csv')

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Users\Compu City\AppData\Local\Programs\Python\Python38\lib\site-packages\pandas\io\parsers.py", line 676, in parser_f
    return _read(filepath_or_buffer, kwds)
  File "C:\Users\Compu City\AppData\Local\Programs\Python\Python38\lib\site-packages\pandas\io\parsers.py", line 454, in _read
    data = parser.read(nrows)
  File "C:\Users\Compu City\AppData\Local\Programs\Python\Python38\lib\site-packages\pandas\io\parsers.py", line 1133, in read
    ret = self._engine.read(nrows)
  File "C:\Users\Compu City\AppData\Local\Programs\Python\Python38\lib\site-packages\pandas\io\parsers.py", line 2037, in read
    data = self._reader.read(nrows)
  File "pandas\_libs\parsers.pyx", line 860, in pandas._libs.parsers.TextReader.read
  File "pandas\_libs\parsers.pyx", line 875, in pandas._libs.parsers.TextReader._read_low_memory
  File "pandas\_libs\parsers.pyx", line 929, in pandas._libs.parsers.TextReader._read_rows
  File "pandas\_libs\parsers.pyx", line 916, in pandas._libs.parsers.TextReader._tokenize_rows
  File "pandas\_libs\parsers.pyx", line 2071, in pandas._libs.parsers.raise_parser_error
pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 7549, saw 8

это ссылка на файл


еще одна вещь, когда я удалил большую часть строк и оставил только 4 строки прочитанными файлом.

Ответы [ 2 ]

1 голос
/ 18 июня 2020

Кажется, что файл разделен ;. Попробуйте:

import pandas as pd
df = pd.read_csv('D:\\work\\amazon\\move_in_links\\final.csv',sep=";")
1 голос
/ 18 июня 2020

По умолчанию pandas предполагает, что ваш csv разделен запятыми ',', вы должны передать правильный разделитель для вызова read_csv.

import pandas as pd
df = pd.read_csv('D:\\work\\amazon\\move_in_links\\final.csv', sep=';')

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

...