Загрузка файла через запятую в информационный кадр - PullRequest
0 голосов
/ 29 октября 2018

Я получил CSV-файл, разделенный запятыми, от Scopus. Каждая строка файла имеет такую ​​структуру:

"A, B, C,D","1111;2222;3333;4444;","A,B,C",1111,"ABCDE","XYZ",,,"338","347",,,"11.10000/111-2-642-35236-2_34",Conference Paper,,Scopus,2-s2.0-1243213123

Хотя он разделен запятыми, в некоторых полях (например, в первом) есть внутренние запятые, которые вызывают ошибку, когда я использую pandas.DataFrame.from_csv, поскольку панды не могут различать запятые-разделители и запятые-разделители. Можно ли как-нибудь загрузить такой CSV-файл в фрейм данных?

1 Ответ

0 голосов
/ 29 октября 2018

если разделитель запятый, то:

df= pd.read_csv("file.csv", delimiter = ',' , header = None) 

пустые значения считаются NaN

         0                     1      2     3         ...                        13  14      15                 16
0  A, B, C,D  1111;2222;3333;4444;  A,B,C  1111        ...          Conference Paper NaN  Scopus  2-s2.0-1243213123

Панды будут определять запятые как разделители и без разделителей, как в строке «A, B, C, D»

...