Как разделить данные на корзины, используя квантили, используя R - PullRequest
0 голосов
/ 10 марта 2019

Допустим, мои сводные данные выглядят следующим образом

   client_id     order_frequency  order_recency  order_monatery   
   Min.   :  1.0   Min.   : 1.000   Min.   : 0.0   Min.   :   5.48  
   1st Qu.:133.5   1st Qu.: 5.000   1st Qu.:12.0   1st Qu.: 414.14  
   Median :282.0   Median : 8.000   Median :30.0   Median : 761.60  
   Mean   :280.1   Mean   : 8.907   Mean   :33.6   Mean   : 880.08  
   3rd Qu.:423.0   3rd Qu.:12.000   3rd Qu.:51.0   3rd Qu.:1215.03  
   Max.   :560.0   Max.   :32.000   Max.   :89.0   Max.   :3493.15

Я хочу разделить эти данные на корзины, используя квантили. По сути, я пытаюсь провести RFM-анализ, и это то, что мне нужно сделать.

fr_tbl <- mutate(frm_tbl_initial, frequency_bins = cut(order_frequency, breaks = c())

У меня есть этот код, но я не уверен, что писать внутри перерывов. Может ли кто-нибудь помочь мне с созданием бункеров с использованием квантилей?

1 Ответ

1 голос
/ 10 марта 2019

При желании разрезать набор данных на равные части (квартили в данном случае), функция принимает одно значение.Принимая во внимание, что вырезать через определенные интервалы вы определяете их вручную.В этом случае вы можете сделать:

cut(order_frequency, breaks = 4)

Например:

cut(c(1:100),breaks=4)

Это создает фактор значений:

levels(cut(c(1:100),breaks=4))

Где каждый из 1:100 значения присваиваются одному из q квартильных сегментов в соответствии с 4 уровнями

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...