Я хочу получить сумму уникальных значений в столбце за год после выполнения некоторых условий.
Вот мои данные из dput:
structure(list(key = structure(c(1L, 1L, 4L, 2L, 3L, 4L, 2L,
3L, 5L, 5L, 8L, 6L, 7L, 8L, 6L, 7L), .Label = c("1992_10_18_0",
"1992_10_18_12", "1992_10_18_18", "1992_10_18_6", "1993_10_18_0",
"1993_10_18_12", "1993_10_18_18", "1993_10_18_6"), class = "factor"),
RR = c(43.25, 43.25, 43.25, 43.25, 43.25, 43.25, 43.25, 43.25,
43.25, 43.25, 43.25, 43.25, 43.25, 43.25, 43.25, 43.25),
dist = c(1000.23361607017, 694.022935174544, 748.618896699399,
812.290633745208, 869.896619169459, 1136.88564181537,
1058.59136791648,
975.756885299645, 1000.23361607017, 694.022935174544,
748.618896699399,
812.290633745208, 869.896619169459, 1136.88564181537,
1058.59136791648,
975.756885299645), Year = c(1992L, 1992L, 1992L, 1992L, 1992L,
1992L, 1992L, 1992L, 1993L, 1993L, 1993L, 1993L, 1993L, 1993L,
1993L, 1993L)), class = "data.frame", row.names = c(NA, -16L
))
Что яwant:
В данных есть четыре столбца: key, RR, dist и Year.
Я хочу получить сумму RR на основе уникальных значений «ключа»в год, так что «dist» меньше или равен 1100.
Что у меня есть:
Я обрабатываю несколько файлов, поэтому скриптэто:
dat<-read.csv("test_dat.csv",header=T,stringsAsFactors=FALSE)
dat2<-dat[which(dat$dist <= 1100),]
dat3<-as.data.frame(cbind(dat2$RR,dat2$Year))
colnames(dat3)<-c("RR","Year")
agg<-aggregate(.~Year,dat3,sum,na.rm=T)
write.csv(agg,file="test.csv",row.names=T)
Есть идеи о том, как я могу сделать это в R?Я буду признателен за любую помощь.