Разделить непрерывную переменную на группы равного размера - PullRequest
0 голосов
/ 12 апреля 2019

У меня есть непрерывная переменная Total_testscore. Я разделил его на 4 группы, но они не имеют одинаковый размер выборки. Как я могу разделить переменную так, чтобы полученные уровни переменной имели одинаковый размер выборки?

> mydata$Total_testscore_f <- cut(mydata$Total_testscore, breaks = 4)
> table(mydata$Total_testscore_f)

(1.99,5.5]    (5.5,9]   (9,12.5]  (12.5,16] 
        25        116         95         50 

1 Ответ

0 голосов
/ 12 апреля 2019

Вы можете использовать функцию quantile() для получения необходимых перерывов. Пример:

> x <- rnorm(100) # replace with your real data
> table(cut(x, breaks = quantile(x, seq(0, 1, l=5)), include.lowest = TRUE))

 [-2.07,-0.756] (-0.756,0.0664]  (0.0664,0.963]    (0.963,2.83] 
             25              25              25              25 
...