На этот вопрос уже был дан ответ, но решения не работают для моей конкретной ситуации.
col1 | col2
A | 0
B | 1
A | 0
A | 1
B | 0
Я в основном ищу это:
col1 | col2 | Percentage
A | 0 | 0.67
A | 1 | 0.33
B | 0 | 0.50
B | 1 | 0.50
Оба столбца являются факторами. Следующие решения - это то, что я продолжаю находить в других темах:
df %>% group_by(col1, col2) %>% summarise(n=n()) %>% mutate(freq = n / sum(n))
or something along those lines.
На самом деле group_by, похоже, вообще ничего не делает. Это не дает мне столбец 'n' или 'freq'. Не знаю, что я делаю не так. Это потому, что я работаю с факторами? Кроме того, если это не очевидно, значения, указанные в столбцах, являются гипотетическими.