У меня есть набор данных ниже, где я хотел бы создать диапазон частот для каждой группы.
Я могу создать то же самое, но не могу настроить размер корзины для каждой группы.
Ниже приведены мои данные.
Date, Group, Sales
Jan-17, A , 1000
Feb-17, A , 1200
Mar-17, A , 700
Apr-17, A , 2000
May-17, A , 1800
Jan-17, B , 5000
Feb-17, B , 5800
Mar-17, B , 6800
Apr-17, B , 7000
May-17, B , 6000
Как видите, группа "A" лежит в диапазоне от 700 до 2000, а группа "B" - в диапазоне от 5000 до 7000. Мой текущий код назначает всю группу на основе одного и того же размера корзины, однако я бы хотел настроить корзину размер основан на макс-мин, деленном на 5 для каждой группы, т.е. здесь я хочу создать 5 разных корзин для каждой группы.
Следовательно, для A я хочу создать 5 ячеек для размера 280 [(2000-700) / 5 => 280], где начало должно быть [700-980], [980-1260], [1260-1540]. Аналогичный подход для группы B. Я хотел бы применить подход для максимума и минимума, как упомянуто выше для всей группы.
Кроме того, было бы замечательно, если бы я каким-то образом мог сопоставить корзину ([700-980]) с моим существующим фреймом данных. Не уверен, возможно ли это.
Ниже приведен мой существующий код со стандартным диапазоном размеров корзины.
df %>%
group_by(Group) %>%
mutate(freq=cut(Sales, breaks=seq(0,8000,by=50), include.lowest=TRUE))
Любые выводы будут высоко оценены.
Спасибо,
J