Binning неравномерно распределенный столбец в R - PullRequest
0 голосов
/ 28 мая 2018

У меня есть столбец в R, который имеет неравномерное распределение, как экспоненциальное распределение.Я хочу нормализовать данные, а затем скопировать данные в последующие сегменты.

Увидел следующие ссылки, которые помогают нормализовать данные, но ничего не дает сгруппировать данные в разные категории.

Нормализацияданные в R

Стандартизировать столбцы данных в R

Пример: как будет выглядеть распределенный столбец по кругу, но с большим количеством строк.

dat <- data.frame(Id = c(1,2,3,4,5,6,7,8),
                  Qty = c(1,1,1,2,3,13,30,45))

Я хочу, чтобы столбец был разбит на 5 категорий, которые могут выглядеть следующим образом:

dat <- data.frame(Id = c(1,2,3,4,5,6,7,8),
                      Qty = c(1,1,1,2,3,13,30,45),
                      Binned_Category = c(1,1,1,1,2,3,4,5))

Выше binned_Category - образец, значения могут не выглядеть так, как указано для данных в реальном мире.Я просто хотел продемонстрировать, как я хочу, чтобы результат выглядел.

1 Ответ

0 голосов
/ 28 мая 2018

Это поможет:

num_bins <- 5
findInterval(Qty, unique(quantile(Qty, prob = seq(0, 1, 1/num_bins))))
...