У меня есть набор данных, в котором есть столбцы subcat и win_price.У меня есть следующий код для представления.
subcat=c(102,141,142)
subcat=rep(subcat,each=8)
winning_price=c(19050,19350,19900,20550,21100,21200)
winning_price=rep(winning_price,4)
ndata=data.frame(subcat,winning_price)
Я рассчитал Q1, Q2 и Q3 для каждого подкадра, используя следующий код:
n=ndata %>%
group_by(subcat) %>%
group_modify(~{
quantile(.x$winning_price, probs = c(0.25, 0.50,0.75)) %>%
tibble::enframe()
})
#adding an quartile column
n$Quantile=ifelse(n$name=="25%","Q1",ifelse(n$name=="50%","Q2",ifelse(n$name=="75%","Q3",0)))
Вывод выглядит так:
Проблема в том, что мне нужно создать набор данных с количеством строк в каждом подкадре и значением процентиля.То есть для подкатегории а) 102, интервал для Q1 составляет <= 19275;Q2 находится между 19275 и 19625;Q3 находится между 19625 и 20687,5;Q4> = 20687,5; b) 141, интервал для Q1 <= 19762,5;Q2 находится между 19762,5 и 20225;Q3 находится между 20225 и 20687,5;Q4> = 20687,5 с) 142, интервал для Q1 <= 19762,5, Q2 между 19762,5 и 20825;Q3 находится между 20825 и 21125;Q4>> = 21125
Фактический набор данных должен быть:
Ожидаемый набор данных:
и т. Д.
Заранее спасибо!