Как прочитать CSV-файл, который имеет двойные кавычки рядом с запятыми - PullRequest
0 голосов
/ 30 ноября 2018

У меня есть CSV-файл, строки которого выглядят следующим образом

q4_1,"blabla,bla",new_label q4_2,alb,new_label2

, и я хотел бы прочитать его в pandas data.frame, который будет выглядеть следующим образом

import pandas as pd

pd.DataFrame({'col1' : ['q4_1','q4_2'],
              'col2' : ['blabla,bla','alb'],
              'col3' : ['new_label','new_label2']})

Какой параметр в функции pd.read_csv мне следует использовать для этого?Я не мог понять это из документации

1 Ответ

0 голосов
/ 30 ноября 2018

С Python 3,7 и Панды 0,23,4 , сработало это:

import pandas as pd

df0 = pd.read_csv('data.csv', names=["col1", "col2", "col3"], squeeze=True)

В результате получается DataFrame со структурой, описанной в вопросе:

    col1        col2        col3
 0  q4_1  blabla,bla   new_label
 1  q4_2         alb  new_label2
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...