EOF внутри строки в кавычках ... тогда больше столбцов, чем имен столбцов - PullRequest
0 голосов
/ 29 июня 2019

Я пытаюсь импортировать данные из файла CSV, и у меня возникает типичная проблема «EOF внутри строки в кавычках».Как и предлагалось во многих других постах, я устанавливаю цитату следующим образом:

orionwebdata <- read.csv("OrionWebData.csv", quote = "")

Но затем я получаю следующую ошибку:

Error in read.table(file = file, header = header, sep = sep, quote = quote,  : 
more columns than column names

Я предполагаю, что, удаляя кавычки, некоторые запятые в кавычкахчитаются и строки разделяются там, где их не предполагается разделять.Другие сообщения предлагали использовать fread:

orionwebdata <- fread("OrionWebData.csv", quote = "")

Но тогда я получаю следующую ошибку:

Warning messages:
1: In fread("OrionWebData.csv", quote = "") :
  Detected 401 column names but the data has 400 columns. Filling rows automatically. Set fill=TRUE explicitly to avoid this warning.
2: In fread("OrionWebData.csv", quote = "") :
  Stopped early on line 7. Expected 401 fields but found 411. Consider fill=TRUE and comment.char=. First discarded non-empty line: <<"2019","0141900001024020","01","01","C","000","   "," ","   ","   "," ","   ","   "," ","   ","0162168","0000000","0000000","00162168","003.72","0000","    ","    ","  ","00"," ","0","0"," ","  ","      ","0000000"," "," ","       ","       "," "," "," ","0","  ","  ","  ","  ","     ","  ","  ","  ","  ","     ","  ","  ","  ","  ","     ","  ","  ","  ","  ","     ","  ","  ","  ","  ","     ","  ","  ","  ","  ","     ","  ","  ","  ","  ","     ","  ","  ","  ","  ","     ","   ","    ","   

Любые предложения о том, как это исправить?

Ответы [ 2 ]

0 голосов
/ 01 июля 2019

По какой-то причине, если я открою это в Excel, сохраните его как файл с разделителями табуляции, а затем откройте в R с помощью:

orionwebdata <- read.delim("OrionWebData_tab.txt", sep = "\t")

тогда это работает. Я думаю, что разделитель запятых по какой-то причине был проблематичным, тогда как компьютер способен правильно интерпретировать вкладки, хотя я не уверен, почему это работает.

0 голосов
/ 29 июня 2019

Проверьте, определенно ли он разделен запятыми. Я получил эту ошибку, используя read.table в слегка странно отформатированном файле с разделителями табуляции, когда я не сказал явно 'sep = '\t', поэтому я думаю, что из-за странности он угадал разделитель неправильно - вы можете попробовать использовать read.csv с sep = ',' записано явно или read.table с разными значениями sep.

...