Извинения - я довольно новичок в R, поэтому я надеюсь, что это не слишком очевидный вопрос.
Я пытался прочитать файл Excel в формате xls в R. Я используюФункция read.xls из пакета gdata.
Сначала я попытался:
V2 <- read.xls("file.xls",header=TRUE)
Но это не могло справиться с тем фактом, что некоторые строки в файле содержат кавычки (") для обозначения дюймов. Это а) вызвалонекоторые поля в V2 для включения нескольких строк из оригинала и б) сгенерировал ошибку «EOF внутри строки», когда он просто прекращает чтение.
Итак, я прочитал об этой проблеме и обнаружил, что решение состоит в том, чтобы отключитьцитирование и скопировал формат, предложенный для кого-то, имеющего ту же проблему с базовой функцией read.csv:
V2 <- read.xls("file.xls",sep=",",quote="",row.names=NULL)
Это правильно читает все строки и избегает предыдущих проблем. Однако это означает, что каждый не-блочная строка в V2 имеет двойные кавычки вокруг нее - даже там, где ранее в данных не было кавычек.
Она также генерирует символ обратной косой черты в каждой строке, которая содержала дюймовую кавычку в оригиналеНапример:
Product GG 7" Tablet
в исходном файле Excel становится
"Product GG 7\" Tablet"
В V2.
Как я могу а) избежать этих обратных слешей в V2 и б) избежать кавычек, появляющихся вокруг каждой строки?