Датафрейм полный <NA> - PullRequest
0 голосов
/ 24 ноября 2018

У меня есть два data.frame: df1

structure(list(trial = c("SA1", "SA1", "SA1", "SA1", "SA1", "SA1"), CID =c(2565L, 8640L, 8456L, 8631L, 9329L, 8683L), SID = c(3L, 87L, 11L, 17L, 6L, 16L), GID = c("GID16170", "GID449286", "GID62427", "GID345692", "GID41372", "GID451760"),TID = c(5428L, 5428L, 5428L, 5428L, 5428L, 5428L)), row.names = c(NA, 6L), class = "data.frame")

и df2

structure(list(GID = c("GID7173723", "GID4878677", "GID88208", "GID346403","GID268825", "GID7399578", "GID6624429"), `1A-1145442` = c(2L, 0L,2L, 2L, 0L, 2L, 2L), `1A-1158042` = c(2L, 0L, 2L, 2L, 0L, 2L, 2L), `1A-1158055` = c(2L, 2L, 2L, 2L, 2L, 2L, 2L), `1A-1229616` = c(2L, 2L, 2L, 2L, 2L, 2L, 2L), `1A-1236254` = c(2L, 2L, 2L, 2L, 2L, 2L, 2L), `1A-1238114` = c(2L, 2L, 2L, 2L, 2L, 2L, 2L)), row.names = c(NA, 7L), class = "data.frame")

, когда я делаю следующее df2[df1$GID] Я получаю:

structure(list(GID = c(NA_character_, NA_character_, NA_character_,NA_character_, NA_character_, NA_character_, NA_character_), `1A-1145442` = c(NA_character_, NA_character_, NA_character_, NA_character_, NA_character_, NA_character_, NA_character_), `1A-1158042` = c(NA_character_, NA_character_, NA_character_, NA_character_, NA_character_, NA_character_, NA_character_), `1A-1158055` = c(NA_character_, NA_character_, NA_character_, NA_character_, NA_character_, NA_character_, NA_character_), `1A-1229616` =c(NA_character_, NA_character_, NA_character_, NA_character_, NA_character_, NA_character_, NA_character_), `1A-1236254` = c(NA_character_, NA_character_, NA_character_, NA_character_, NA_character_, NA_character_, NA_character_), `1A-1238114` = c(NA_character_, NA_character_, NA_character_, NA_character_, NA_character_, NA_character_, NA_character_)), row.names = c("NA", "NA.1", "NA.2", "NA.3", "NA.4", "NA.5", "NA.6"), class = "data.frame")

Что не так с моим кодом?Я хочу расширить строки в df2 до 2700 строк.В основном df1 имеет 2700 строк, а df2 2180 строк.Кроме того, df2 $ GID в основном unique(df1$GID), поэтому все значения df2 $ GID находятся внутри df1 $ GID.плюс df2 $ GID имеет дублированные значения.

С уважением

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...