Я новичок в R и кодировании в целом. У меня есть большой набор данных, но вот образец. Для каждого месяца каждого года каждый case_number должен быть классифицирован как РЕБЕНОК или ВЗРОСЛЫЙ и подсчитан. Номер дела может повторяться через месяц, но каждый case_number может учитываться только один раз в месяц. ad, cs и em - это векторы, которые включают служебные коды.
Конечный результат, который мне нужно сгенерировать, имеет следующие столбцы: YEAR, MONTH, ADULT_COUNT, CHILD_COUNT. Case_number будет учитываться в каждом месяце в соответствии со следующими правилами:
# create sample dataset
case_number <- c(1,1,1,1,2,2,3,4,4,4,5,5)
age_at_service <- c(20,20,20,20,34,34,15,45,45,45,24,24)
cost_center <- c(4000,4121,2000,2000,4000,121,2000,2121,4000,121,121,121)
year <- c(2019, 2019, 2019, 2019, 2019, 2019, 2019, 2019, 2019, 2019, 2019, 2019)
month <- c(1,1,1,1,2,1,1,1,1,1,2,2)
date <- c('1/12/2019','1/11/2019','1/8/2019','1/1/2019','2/3/2019'
,'1/7/2019','1/4/2019','1/23/2019','1/12/2019','1/3/2019','2/12/2019','2/14/2019')
date <- as.Date(date,format = '%m/%d/%Y')
tb <- tibble(case_number, age_at_service, cost_center, month, year, date)
# service codes
ad <- c(4000,4121)
cs <- c(2000,2121)
em <- (121)
У меня есть создал более простой c код, но я не уверен, с чего начать для этой задачи. Любое направление ценится.