pandas.errors.ParserError: Ошибка может быть вызвана игнорированием кавычек при использовании разделителя из нескольких символов - PullRequest
0 голосов
/ 30 октября 2018

Я получаю ParserError, когда пытаюсь прочитать csv-файл с помощью Pandas. Ниже приведена ошибка и набор данных, который выбросил эту ошибку.

pandas.errors.ParserError: Expected 10 fields in line 8, saw 11. Error could possibly be due to quotes being ignored when a multi-char delimiter is used.

Ниже приведена строка 8 с этой ошибкой

10/29/18 10:20,85505306,    Scott,20181029102023-file.csv,  22.49,-12.18,CITY,,12:15.0,51:00.0,ABCD,9898,320,D231

Я читаю CSV, используя следующую команду:

df.to_csv('file.csv'), index = False)

Пример вывода файла CSV:

File_Received_Time  Label1  City    FileName    Label2  Label3  State   Unnamed: 12 cTimestamp  dTimestamp  Label4  Label5  Label6  Label7  Label8
10/29/18 10:20  56776   Paris   file1.csv   29  29  IL      29-10-2018 04:11:11     COL06   620 398 516 451
10/29/18 10:20  46069   Hongkong    file2.csv   61  58  VA      29-10-2018 04:03:17 28-10-2018 05:58:00 COL06   576 645 349 374
10/29/18 10:20  47240   Sydney  file3.csv   43  42  IL      29-10-2018 04:12:46     COL06   534 2047    56831   372
10/29/18 10:20  47432   NewYork file4.csv   55  61  OH          28-10-2018 09:01:00 COL06   514 2354    640 633
10/29/18 10:20  41794   London  file5.csv   39  29          29-10-2018 04:12:46 28-10-2018 09:01:00 COL06   470 2354    56831   550
10/29/18 10:20  49643   LA  file6.csv   55  43  TX      29-10-2018 04:05:18     COL06   523 2301    53942   403
10/29/18 10:20  54700   Shangai file7.csv   37  29  AZ      29-10-2018 04:12:15 28-10-2018 12:51:00 COL06   569 2683    53642   538
10/29/18 10:20  37134   Singapore   file8.csv   53  62  AZ      29-10-2018 04:09:16     COL06   560 391 54541   542
10/29/18 10:20  51144   Taiwan  file9.csv   43  33  TX      29-10-2018 04:12:15     COL06   469 472 458 481

Ответы [ 2 ]

0 голосов
/ 02 апреля 2019

У меня было то же сообщение об ошибке. Я удалил двойные кавычки из файла, и это решило проблему. Я использовал следующую строку в терминале:

cat merged.csv | tr «» »« o »> merged.tsv

Надеюсь, что это поможет.

0 голосов
/ 30 октября 2018

Я могу прочитать вставленную выше ошибку:

Для чтения csv через панд используйте read_csv:

Я вставил запись ошибки в csv:

mayankp@mayank:~/Documents cat t1.csv 
10/29/18 10:20,85505306,    Scott,20181029102023-file.csv,  22.49,-12.18,CITY,,12:15.0,51:00.0,ABCD,9898,320,D231

Теперь я читаю это в пандах, как показано ниже:

In [114]: df = pd.read_csv('/home/mayankp/Documents/t1.csv', header=None)

In [115]: df
Out[115]: 
               0         1          2                        3      4      5     6   7        8        9     10    11   12    13
0  10/29/18 10:20  85505306      Scott  20181029102023-file.csv  22.49 -12.18  CITY NaN  12:15.0  51:00.0  ABCD  9898  320  D231

Работает нормально. Дайте мне знать, если это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...