У меня есть следующий набор данных:
structure(list(SERIAL = c(118694001L, 118694001L, 118694001L,
118695001L, 118696001L, 118696001L, 118696001L, 118697001L, 118698001L,
118698001L, 118699001L, 118699001L, 118699001L, 118700001L, 118700001L,
118701001L, 118701001L), RELATED = c(9999L, 9999L, 9999L, 3100L,
3100L, 3100L, 3100L, 3100L, 3100L, 3100L, 9999L, 9999L, 9999L,
3100L, 3100L, 3100L, 3100L)), class = "data.frame", row.names = c(NA,
-17L))
Я хочу создать новый столбец 'count', который подсчитывает число 3100 в столбце RELATED, но его нужно сгруппировать поSERIAL.
Я пробовал
df <- within(data, DILs2 <- ave(SERIAL, list(SERIAL, RELATED == 3100), FUN=length))
Результат должен выглядеть следующим образом:
SERIAL RELATED Count
118694001 9999 0
118694001 9999 0
118694001 9999 0
118695001 3100 1
118696001 3100 3
118696001 3100 3
118696001 3100 3
118697001 3100 1
118698001 3100 2
118698001 3100 2
118699001 9999 0
118699001 9999 0
118699001 9999 0
118700001 3100 2
118700001 3100 2
118701001 3100 2
118701001 3100 2