read.csv предупреждение 'EOF внутри строки в кавычках', чтобы прочитать весь файл - PullRequest
0 голосов
/ 14 мая 2018

У меня есть файл .csv, который содержит 285000 наблюдений. Как только я попытался импортировать набор данных, вот предупреждение, которое показывает 166000 наблюдений.

Joint <- read.csv("joint.csv", header = TRUE, sep = ",")

Предупреждающее сообщение: При сканировании (файл = файл, что = что, sep = sep, quote = quote, dec = dec,: EOF в кавычках

Когда я закодировал с цитатой, следующим образом:

Joint2 <- read.csv("joint.csv", header = TRUE, sep = ",", quote="", fill= TRUE)

Ошибка в read.table (file = file, header = header, sep = sep, quote = quote,: больше столбцов, чем имена столбцов

Когда я так закодировал, он показывает 483000 наблюдений:

Joint <- read.table("joint.csv", header = TRUE, sep = ",", quote="", fill= TRUE)

Что я должен сделать, чтобы правильно прочитать файл?

1 Ответ

0 голосов
/ 14 мая 2018

Я думаю, что проблема связана с кодировкой файлов. В шапке много специальных символов. Если вы знаете, как кодируется ваш файл, вы можете указать с помощью аргумента fileEncoding значение read.csv.

В противном случае вы можете попытаться использовать fread из data.table . Он может читать файл, несмотря на проблемы с кодировкой. Это также будет значительно быстрее для чтения такого большого файла данных.

...