восстановить данные в csv файле - PullRequest
1 голос
/ 12 сентября 2010

У меня огромный CSV-файл, разделенный запятыми, и я хочу провести анализ с помощью glm в R. В одном столбце есть данные с запятой, что-то вроде: Bla, Blabla При чтении файла в R с read.csv.sql появляется сообщение об ошибке: Драйвер RS-DBI: (RS_sqlite_import: ./agp.csv строка 47612 ожидала 37 столбцов данных, но нашла 38) Это связано с «лишней» запятой в некоторых данных, а не во всем столбце есть дополнительный столбец. Как я могу это исправить? Я хочу удалить эту лишнюю запятую. Спасибо за реакцию, Андре

Ответы [ 2 ]

1 голос
/ 12 сентября 2010

Формат CSV очень прост и может быть легко отредактирован вручную. Чтобы включить запятую в значение, необходимо заключить его в кавычки. Попробуйте это: "bla,blabla". Если эти данные содержат какие-либо кавычки, например. blah,"thequotedblah",blah, эти кавычки должны быть экранированы другой кавычкой, например: "blah,""thequotedblah"",blah".

Хотя официального стандарта вокруг него нет, формат CSV не так уж и велик. В Википедии есть замечательная ссылка CSV , которую я лично использовал для реализации поддержки CSV в приложениях. Потратьте 5-10 минут на чтение, и вы узнаете все, что вам когда-либо понадобится для создания / чтения / восстановления данных CSV вручную.

0 голосов
/ 12 сентября 2010

Это только одна строка, которая содержит запятую без кавычек, или таких строк несколько?Редактирование .csv с помощью редактора, который может обрабатывать большие файлы (например, Ultraedit), чтобы очистить эту запись, безусловно, поможет.Предложение Асафа о цитировании также является хорошим тоном.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...