У меня есть такой набор данных:
Age <- rnorm(n=100, mean=20, sd=5)
ind <- which(Age %in% sample(Age, 50))
Age[ind]<-NA
Age2 <- rnorm(n=100, mean=20, sd=5)
ing <- which(Age2 %in% sample(Age2, 50))
Age2[ing]<-NA
Age3 <- rnorm(n=100, mean=20, sd=5)
int <- which(Age3 %in% sample(Age3, 50))
Age3[int]<-NA
data<-data.frame(Age,Age2,Age3)
Это старый набор данных, составленный несколькими разными людьми, где несколько столбцов означают одно и то же (в реальном наборе данных есть несколько столбцов для возраста),Как видите, есть довольно много АН.Я хотел бы создать единую колонку "возраст".Чтобы сделать это, я хотел бы в идеале использовать число из первого столбца возраста, но если это NA, я бы предпочтительно использовал число из Age2, а если это также NA, я бы использовал Age3, и я 'Я хотел бы сделать это в таком порядке (Age3 никогда не заменит Age2 и т. д.), поскольку я доверяю людям, которые вводят данные в таком порядке, ха-ха.
Мне известны другие ответы здесь длязаполнение столбцов на основе нескольких условий, например: dplyr, заменяющий значения n в столбце на основе нескольких условий Но я не уверен, как расставлять приоритеты.Спасибо!