У меня есть два набора данных, содержащих много данных. Первоначально я хотел составить список rsID, которые были общими для двух наборов данных, поэтому я написал следующее:
file1 <- read.csv("CKD.csv", header = TRUE, sep = ",")
file2 <- read.csv("eGFR.csv", header = TRUE, sep = ",")
write.table(file1$rsID.[match(file1$rsID., file2$rsID., nomatch = NA, incomparables = TRUE)],
"rs_matches_Raw.csv", sep = ",", row.names = FALSE, col.names = c("rsID.")
)
x <- read.csv("rs_matches_Raw.csv",header = TRUE, sep = ",")
write.table(na.omit(x), "rs_matches_final", sep = ",", row.names = FALSE, col.names = c("rsID."))
Он сделал то, что хотел. Теперь я хочу получить дополнительную информацию; например, хромосомное местоположение. Есть ли способ, которым я могу использовать свой результат выше и применить его к набору данных, чтобы получить остальную информацию?
Например: предположим, что rs1, rs2 и rs3 находятся в обоих файлах.
x <- c ("rs1", "rs2", "rs3") </p>
f (x) = variableIDrs1, variableIDrs2, variableIDrs3 * option03
И в идеале получить больше информация, кроме этого, но это только пример.
Я попытался использовать match.data.frame из EcFun и внутреннее соединение из plyr. Спасибо.