Найти процент с помощью group_by и суммировать в R через dplyr - PullRequest
0 голосов
/ 27 августа 2018

У меня есть некоторые данные об образовании людей. Информация о пользователе может иметь дубликаты, поэтому я использую Unique_Elements для извлечения каждой записи только один раз.

demographics %>%
group_by(Academic_Level) %>%
summarise(Unique_Elements = n_distinct(userID))

Вывод выглядит примерно так:

Academic_Level     Unique_Elements
Freshman           22
Sophomore          76
Junior             87
Senior             56
NA                 10  # Non responding candidates

Общая стоимость N = 253.

Теперь, если я хочу отредактировать приведенный выше код для получения процентов, что мне делать?

Я видел следующие два связанных поста, но они мне не помогают. Любые советы по этому вопросу будут высоко оценены. Спасибо!

Относительные частоты / пропорции с dplyr

Поиск процента в подгруппе с использованием group_by и суммирование

1 Ответ

0 голосов
/ 27 августа 2018

Мы можем попробовать

demographics %>%
  group_by(Academic_Level) %>%
  summarise(Unique_Elements = n_distinct(userID)) %>%
  mutate(perc = 100 * Unique_Elements/sum(Unique_Elements))
...