Может быть, вам нужно только среднее значение isYes
для каждого sum
? Если это верно, вы можете просто использовать:
df %>% group_by(sum) %>% summarise(perc = mean(isYes))
(он должен быть таким же, как df %>% group_by(sum) %>% summarise(perc = sum(isYes)/n())
.)
Результат:
# A tibble: 2 x 2
sum perc
<int> <dbl>
1 2 0.5
2 5 1