сгруппировать по двум переменным, а затем посчитать строковое значение - PullRequest
2 голосов
/ 18 марта 2020

content table

Я хочу сосчитать все OV и G в колонке Kwaleitsbeoordeling. И я хочу группу на Бранш и Статус.

df %>% 
group_by(Status) %>% 
Group
  summarize(mean_value = count(Kwaliteitsbeoordeling))

Как суммировать строковое значение? и группа на 2 разных колонны?

Обновление:

Ожидаемый результат:

enter image description here

обновление данных

Идентификатор проекта Branche Status HUB Районный управляющий Kwaliteitsbeoordeling Algemene_indruk Arbo aanvullende_dienstverlening 1 Отели в Утрехте, Янссен, ОВОВ
2 в настоящее время не доступны Overheid huidig ​​Амстердам Хартман ВВГВ
4 Onderwi js opgezegd Амстердам Verhoeven VOG NVT
5 Еда huidig ​​Амстердам Хартман ОООV
6 Розничная торговля opgezegd Утрехт Янссен Г.О.
8 отелей opgezegd Barendrecht Velzeboer GVVG
9 Food huidig ​​Амстердам Хартман OOGO
10 Onderwi js opgezegd Барендрехт Блюдо VGO NVT

1 Ответ

1 голос
/ 18 марта 2020

Мы можем создать группу по n(), а затем изменить ее на «широкий» формат

library(dplyr)
library(tidyr)
df %>%
   group_by(Project_ID, Branche, Kwaliteitsbeoordeling) %>%
   summarise(n = n()) %>%
   pivot_wider(names_from = Kwaliteitsbeoordeling, values_from = n, 
         values_fill = list(n = 0))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...