Добрый день всем.
Я знаю, что это довольно простой вопрос, хотя я просто не понимаю, почему он не работает так, как я ожидал.
Задача следующая:
У меня есть файл data.csv, представленный в этом формате:
id,"feature_1","feature_2","feature_3"
00100429,"PROTO","Proprietary","Phone"
00100429,"PROTO","Proprietary","Phone"
Дело в том, чтобы импортировать эти данные, используя панд.Я знаю, что по умолчанию pandas read_csv использует разделитель запятых, поэтому я просто импортировал его следующим образом:
data = pd.read_csv('data.csv')
И результат, который я получил, был представлен в начале без изменений.Я имею в виду один столбец, который содержит все.
Я пробовал много других разделителей, используя регулярные выражения, и единственный, который внес какое-то улучшение, был:
data = pd.read_csv('data.csv',sep="\,",engine='python')
С одной стороны, он окончательно отделилсявсе столбцы, с другой стороны, способ представления данных не так удобен для использования.В частности:
"id ""feature_1"" ""feature_2"" ""feature_3"""
"00100429 ""PROTO"" ""Proprietary"" ""Phone"""
Поэтому я думаю, что где-то должна быть ошибка, потому что данные вроде бы в порядке.
Итак, вопрос - как импортировать CSV-файл с разделенными столбцами и без символов тройных кавычек?
Спасибо.