У меня есть файл .csv, который можно прекрасно прочитать в панде DataFrame, он имеет один столбец, назовем его Column1
с 5 различными значениями (0,1,2,3,4
), и я пытаюсь создать четыре новых файла CSV, по одному для каждой из моих категорий.
Для этого я использую pd.to_csv
с параметрами по умолчанию. Однако моя проблема заключается в том, что второй столбец моего информационного кадра образован строками (которые заключены в кавычки), которые могут иметь точки разрыва внутри них, поэтому, когда я создаю новый файл, данные Column2
будут перемещены в Column1
. Вот так:
Column1 Column2
0 'this is correct'
1 'this
is not correct'
Есть ли у вас какие-либо подсказки, как я могу создать новый фрейм данных без этого эффекта? Я не могу поместить исходный файл, из которого я читаю свой набор данных, из-за его большой плотности, но при необходимости я могу попытаться создать пример.
Я пробовал аргумент line_separator = \n
в pandas.to_csv()
, но он дает ошибку, поскольку каждая строка файла, который я читаю, должна быть одной строкой в моем новом файле.