Предположим, я оцениваю с помощью пакета fable следующую модель, используя ежедневные данные за 2019 год, где x - экзогенная объясняющая переменная. Термины pdq(p = 1, d = 0, q = 0)
и PDQ(P = 0, D = 0, Q = 0)
означают, что это авторегрессивная модель.
library(tidyverse)
library(fable)
load(file, "Some data.RData")
fit <- dta_2019 %>%
tsibble() %>%
model(ar = ARIMA(y ~ x + pdq(p = 1, d = 0, q = 0) + PDQ(P = 0, D = 0, Q = 0)))
Теперь мне нужно использовать эту модель для запуска прогноза по ежедневным данным на 2020 год, но предположим, что данные начинаются в феврале 2020 года.
forecast_2020 <- fit %>%
forecast(new_data = tsibble(dta_2020))
Насколько я понимаю, значение запаздывания y для прогноза, которое требуется, учитывая, что это авторегрессивная модель, будет последним значением, наблюдаемым в набор оценочных данных ( dta_2019 ). Можно ли инициализировать значение y чем-то другим? Я попытался включить строку в dta_2020 , которая содержит, в данном конкретном примере, наблюдение за 31 января, но в результате этого прогноз начинается 31 января.