Тарифы с использованием группового обледенения с басней - PullRequest
0 голосов
/ 01 мая 2020

Поскольку я довольно новичок в басне для R, мне было интересно, можно ли также прогнозировать скорость вместо числа в сгруппированном временном ряду.

Вот краткий пример созданного мною цибла :

   head(data)
   # A tsibble: 6 x 5 [1Y]
   # Key:       sex, age [1]
   year sex   age   counts      pop
  <dbl> <chr> <chr>  <dbl>    <dbl>
1  2005 m     <50     1294 25986547
2  2006 m     <50     1417 26261652
3  2007 m     <50     1690 25712000
4  2008 m     <50     1827 25385000
5  2009 m     <50     1973 25037000
6  2010 m     <50     2076 24678000

Как вы можете видеть, есть две группы: пол (m / f) и возрастные категории (<50, 50-55,55-60, ...). pop обозначает население, а count - число определенных событий в год (2005-2018). </p>

Я добавил столбец инцидентности к

data%>%mutate(incidence=(counts/pop))

Теперь я хотел бы подобрать модель аримы для инцидентности:

# Fit model 
+     model(arima = ARIMA(incidene)) %>%
+     # reconcile
+     mutate(mint = min_trace(incidence)) %>%
+     # forecasts
+     forecast(h = 10)

Однако я не знаю, как получить прогноз заболеваемости для группы топ-серии? Для данных подсчета я бы использовал:

# create aggregates
+     aggregate_key(sex * age, value = (sum(counts))

, но это просто включает сумму подсчетов, которая неприменима для показателей заболеваемости ...

Может быть, кто-то может мне помочь?

Заранее спасибо!

1 Ответ

1 голос
/ 01 мая 2020

Вы на правильном пути с aggregate_key(), который является первым шагом иерархического согласования с басней. Вы можете использовать aggregate_key() для вычисления агрегации counts = sum(counts) и pop = sum(pop), а затем вычислить incidence = counts / pop с использованием mutate().

Редактировать: Однако, поскольку крысы ios не сохраняются в агрегации, само соотношение не может быть легко выверено.

...