[R]: read.csv разбивает строку - PullRequest
       0

[R]: read.csv разбивает строку

3 голосов
/ 10 февраля 2020

Я читаю данные во фрейм данных R, используя read.csv2. С одним из моих наборов данных, несколько переменных помещаются в следующую строку, создавая дополнительные строки и обрезая столбцы. Для иллюстрации: Мой CSV выглядит следующим образом:

var1,var2,var3
value1,value2,value3
value1,value2,value3

Фрейм данных, однако, выглядит следующим образом:

var1    var2
value1  value2
value3
value1  value2
value3

Я использовал одну и ту же команду во многих CSV- файлы, даже на одном с другим образцом того же самого файла, но никогда не получали эту проблему. Есть кто-нибудь с идеей, что может вызвать это?

Редактировать: так как я до сих пор не уверен, как загрузить фактический набор данных, я загрузил скриншот того, как это выглядит. Разделение происходит в каждой строке с более чем 3 столбцами. enter image description here

Ответы [ 2 ]

1 голос
/ 13 февраля 2020

В ваших данных у вас неравное количество столбцов в файле, поэтому вы не можете просто использовать read.csv и должны использовать read.table с fill=TRUE. Заполните col.name соответствующим количеством имен столбцов, чтобы оно соответствовало вашей структуре данных. На вашем скриншоте есть как минимум 6 столбцов.

read.table(dat, header = FALSE, sep = ",", 
      col.names = c("col_name1", "col_name2", "col_name3"), fill = TRUE)

Для получения дополнительной информации см. ответ .

0 голосов
/ 14 февраля 2020

Спасибо, @jyr! Это имеет смысл, и пока все работает нормально. Есть ли способ, которым R может определить фактическое количество необходимых столбцов?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...