У меня есть набор данных, в котором четыре переменные имеют одинаковые значения. Теперь я хочу рассчитать процентные доли для значений в каждой переменной, чтобы я мог построить их в виде столбчатой диаграммы с накоплением.
Это пример набора данных:
climate_change air_quality water_polution trash
<chr> <chr> <chr> <chr>
1 Not a very serious probl~ A somewhat serious prob~ A somewhat serious problem A very serious problem
2 Not a very serious probl~ Not a very serious prob~ Not a very serious problem Not a very serious pr~
3 NA NA NA NA
4 NA NA NA NA
5 A very serious problem A very serious problem A very serious problem A very serious problem
6 A somewhat serious probl~ A very serious problem Not at all a serious prob~ A somewhat serious pr~
Я знаю, как для вычисления процентных долей для каждой переменной, например:
lebanon %>%
filter(!is.na(climate_change)) %>%
count(climate_change) %>%
mutate(prop = n / sum(n))
Получение:
climate_change n prop
<chr> <int> <dbl>
1 A somewhat serious problem 348 0.286
2 A very serious problem 620 0.510
3 Not a very serious problem 202 0.166
4 Not at all a serious problem 45 0.0370
Теперь я хочу найти решение для сохранения значений, перечисленных в виде строк, при наличии переменные перечислены в виде столбцов со значениями n и / или prop. Каким будет наиболее эффективный способ решить эту проблему?
Я хочу иметь что-то вроде этого:
climate_change air_quality ..... .....
<chr> <dbl>
1 A somewhat serious problem 0.286 .....
2 A very serious problem 0.510 .....
3 Not a very serious problem 0.166
4 Not at all a serious problem 0.0370
Мне было трудно описать эту проблему и найти похожий вопрос по этому поводу сайт. Надеюсь, я хорошо его описал, и если вы знаете похожий вопрос, просто дайте ссылку здесь. :)
Приветствую