R group_by и подведение итогов не работает как надо .. понятия не имею, почему - PullRequest
0 голосов
/ 08 февраля 2020

Это должно ДЕЙСТВИТЕЛЬНО работать, но это не так, и я схожу с ума!

Это мои данные

   > head(dataset_2,n=5)
  CUSTOMER_NUMBER OLD_NEW_CLIENT COMPLETION_PRCT CRASH_RISK
1       535961675     Old client            0.06         25
2       223186690     Old client            0.04         24
3       217140964     Old client            0.05         32
4       514559839     Old client            0.10         52
5        10991413     Old client            0.53         15

> str(dataset_2)

'data.frame':   90405 obs. of  4 variables:
 $ CUSTOMER_NUMBER: int  535961675 223186690 217140964 514559839 10991413 506839750 15102896 34980927 578647941 804552857 ...
 $ OLD_NEW_CLIENT : chr  "Old client" "Old client" "Old client" "Old client" ...
 $ COMPLETION_PRCT: num  0.06 0.04 0.05 0.1 0.53 0.05 0.06 0.06 1 0.09 ...
 $ CRASH_RISK     : num  25 24 32 52 15 38 42 42 41 78 ...
 - attr(*, ".internal.selfref")=<externalptr> 

Я хочу суммировать количество клиентов по всем другим столбцам - так комбинации old_new_client, завершения_prct и crash_risk и количество клиентов, попадающих в эту корзину. Но когда я набираю код:

  by_parameters <-dataset_2 %>%
  group_by(OLD_NEW_CLIENT, COMPLETION_PRCT, CRASH_RISK) %>%
  summarize(clients=n_distinct(CUSTOMER_NUMBER))

, я получаю:

> by_parameters
  clients
1   90399

Спасибо за любую помощь!

1 Ответ

0 голосов
/ 08 февраля 2020

OK! Использование dyplyr I / O Plyr помог! решено

...