Это должно ДЕЙСТВИТЕЛЬНО работать, но это не так, и я схожу с ума!
Это мои данные
> head(dataset_2,n=5)
CUSTOMER_NUMBER OLD_NEW_CLIENT COMPLETION_PRCT CRASH_RISK
1 535961675 Old client 0.06 25
2 223186690 Old client 0.04 24
3 217140964 Old client 0.05 32
4 514559839 Old client 0.10 52
5 10991413 Old client 0.53 15
> str(dataset_2)
'data.frame': 90405 obs. of 4 variables:
$ CUSTOMER_NUMBER: int 535961675 223186690 217140964 514559839 10991413 506839750 15102896 34980927 578647941 804552857 ...
$ OLD_NEW_CLIENT : chr "Old client" "Old client" "Old client" "Old client" ...
$ COMPLETION_PRCT: num 0.06 0.04 0.05 0.1 0.53 0.05 0.06 0.06 1 0.09 ...
$ CRASH_RISK : num 25 24 32 52 15 38 42 42 41 78 ...
- attr(*, ".internal.selfref")=<externalptr>
Я хочу суммировать количество клиентов по всем другим столбцам - так комбинации old_new_client, завершения_prct и crash_risk и количество клиентов, попадающих в эту корзину. Но когда я набираю код:
by_parameters <-dataset_2 %>%
group_by(OLD_NEW_CLIENT, COMPLETION_PRCT, CRASH_RISK) %>%
summarize(clients=n_distinct(CUSTOMER_NUMBER))
, я получаю:
> by_parameters
clients
1 90399
Спасибо за любую помощь!