Кажется, я застрял, пытаясь обобщить вхождение данного столбца (df$fam
).Как видите, он содержит уникальные идентификаторы для каждого наблюдения.Однако в некоторых случаях эти идентификаторы встречаются более одного раза.Я пытаюсь найти способ создать столбец, показывающий количество случаев (df$fam_N
) для каждого индивидуального наблюдения (т. Е. Мне нужно найти способ обойти group_by
).
df<- df%>% group_by(fam) %>% summarise(fam_N = sum(n())))
> table(df$fam_N)
> 1 2 3 4 5 6 7 8 9 11 48
> 1296 125 97 113 119 56 19 8 3 1 1
> str(df$fam)
> chr [1:3503] "475124" "574675" "439440" "439440" "465883"
> "571875" "571921" "571875" "574620" "459136" "387418" "513654" ..`
желаемый вывод:
table(df$fam, df$fam_N)
475124 1
574675 1
439440 2
439440 2
465883 1