У меня есть таблица данных с несколькими столбцами.Скажем,
Location
, который может включать Los Angles
и т. Д.
age_Group
, скажем, (young
, child
, teenager)
и т. Д.
year = (2000, 2001, ..., 2015)
month = c(jan, ..., dec)
Я хотел бы group_by
их и посмотреть, сколько людей потратило деньги за определенные промежутки времени, скажем, у меня есть интервалы interval_1 = (1, 100)
, (100, 1000)
, ...
, interval_20=(1000, infinity)
Как мне поступить?Что мне делать после следующего?
data %>% group_by(location, age_Group, year, month)
образец:
location age_gp year month spending
LA child 2000 1 102
LA teen 2000 1 15
LA teen 2000 10 9
NY old 2000 11 1000
NY old 2010 2 1000000
NY teen 2020 3 10
желаемый результат
LA, child, 2000, jan interval_1
LA, child, 2000, feb interval_20
...
NY OLD 2015 Dec interval_1
последний столбец должен быть определен путем добавления расходоввсех людей, принадлежащих к одному городу, возраст_группа, год, месяц.