У меня есть следующий набор данных:
Year <- c(2000, 2000, 2000, 2000, 2001, 2001, 2001, 2001)
Company_1 <- c(1, 2, 3, NA, 4, 5, 6, 7)
Company_2 <- c(8, 9, NA, NA, 10, 11, 12, 13)
data <- data.frame(Year, Company_1, Company_2)
Для каждого года я хочу получить количество наблюдений, не относящихся к NA:
data %>% group_by(Year) %>% summarise_all(funs(N = sum(!is.na(.))))
Как видно, вГод 2000, компания 2 имеет только 2 наблюдения.Требование: рассматривать данные за год только в том случае, если общее количество наблюдений в этом году> 2.
Поэтому я хочу заменить эти два наблюдения на NA.
Company_2 станет:
Company_2 <- c(NA, NA, NA, NA, 10, 11, 12, 13)
Не могли бы вы потратить некоторое время, чтобы предложить некоторые решения для этого случая?