У меня есть следующий набор данных (32000 записей) среднегодовых значений химических соединений воды, упорядоченных по участкам мониторинга и году отбора проб, например, следующим образом:
data= data.frame(Site_ID=c(1, 1, 1, 2, 2, 2, 3, 3, 3), Year=c(1976, 1977, 1978, 2004, 2005, 2006, 2003, 2004, 2005), AnnualMean=c(1.1, 1.2, 1.1, 2.1, 2.6, 3.1, 2.7, 2.6, 1.9))
Я хотел бы выбрать только данные из всех участков мониторинга которые имеют по крайней мере n измерений между годом1 и годом2? Обычно я хотел бы выбрать все данные с сайтов мониторинга, которые показывают 10 измерений в период между 1990 и 2005 годами. До сих пор я пытался безуспешно:
data %>%
group_by(Site_ID) %>%
filter(n()>=n %in% between(Year, year1, year2))