Получение общего числа строк в каждом квантиле - PullRequest
0 голосов
/ 11 июня 2019

У меня есть набор данных, в котором есть столбцы subcat и win_price.У меня есть следующий код для представления.

subcat=c(102,141,142)
subcat=rep(subcat,each=8)

winning_price=c(19050,19350,19900,20550,21100,21200)
winning_price=rep(winning_price,4)

ndata=data.frame(subcat,winning_price)

Я рассчитал Q1, Q2 и Q3 для каждого подкадра, используя следующий код:

n=ndata %>%
  group_by(subcat) %>% 
  group_modify(~{
    quantile(.x$winning_price, probs = c(0.25, 0.50,0.75)) %>% 
      tibble::enframe()
  }) 

#adding an quartile column
n$Quantile=ifelse(n$name=="25%","Q1",ifelse(n$name=="50%","Q2",ifelse(n$name=="75%","Q3",0)))



Вывод выглядит так:

enter image description here

Проблема в том, что мне нужно создать набор данных с количеством строк в каждом подкадре и значением процентиля.То есть для подкатегории а) 102, интервал для Q1 составляет <= 19275;Q2 находится между 19275 и 19625;Q3 находится между 19625 и 20687,5;Q4> = 20687,5; b) 141, интервал для Q1 <= 19762,5;Q2 находится между 19762,5 и 20225;Q3 находится между 20225 и 20687,5;Q4> = 20687,5 с) 142, интервал для Q1 <= 19762,5, Q2 между 19762,5 и 20825;Q3 находится между 20825 и 21125;Q4>> = 21125

Фактический набор данных должен быть:

enter image description here

Ожидаемый набор данных:

enter image description here и т. Д.

Заранее спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...