У меня есть данные панели, где некоторые переменные отсутствуют.Я намерен отбросить идентификаторы, в которых переменные заполнены только на один год (и 2, 3 и т. Д.), Так как это не дает мне достаточно истории для работы.
Мой пример данных выглядит следующим образом:
id <- c('a','b','c','d','a','b','c','d','a','b','c','d','a','b','c', 'd')
time <- c(2000,2000,2000,2000,2001,2001,2001,2001,2002,2002,2002,2002, 2003,2003,2003,2003)
x <- c(1,2,NA,NA,4,5,NA,NA,7,8,9,NA,10,11,12,12)
y <- c(NA,2,NA,NA,4,5,NA,NA,7,8,9,NA,10,11,12,12)
z <- c(NA,2,NA,NA,4,5,NA,NA,7,8,9,NA,NA,11,12,NA)
w <- c(NA,2,NA,NA,4,5,NA,NA,7,8,9,NA,NA,11,12, 12)
mydata <- data.frame(id, time, x, y, z, w)
Я попробовал следующее:
library(dplyr)
mydata.imp <- mydata %>% group_by(id,time) %>% filter(n()>1)
Но в итоге я получаю 0 наблюдений, где, как я должен был иметь идентификатор a, b, c в моем фрейме данных, когда я опускаюсь наусловие на один год (и a, b только с условием на 2 года).
Мой ожидаемый кадр данных для условия на один год следующий:
id <- c('a','b','c','a','b','c','a','b','c','a','b','c')
time <- c(2000,2000,2000,2001,2001,2001,2002,2002,2002,2003,2003,2003)
x <- c(1,2,NA,4,5,NA,7,8,9,10,11,12)
y <- c(NA,2,NA,4,5,NA,7,8,9,10,11,12)
z <- c(NA,2,NA,4,5,NA,7,8,9,NA,11,12)
w <- c(NA,2,NA,4,5,NA,7,8,9,NA,11,12)
mydata.imp <- data.frame(id, time, x, y, z, w)
Любая помощь вообще очень ценится,Спасибо!