У меня есть месячные данные временного ряда вместе с некоторыми производными переменными (от даты), и мой фрейм данных мы можем создать из приведенного ниже кода на языке R .
Date = seq(as.Date("2018-06-01"), as.Date("2019-05-01"), by="months")
AMOUNT = c(1300,1023,3310,4120,4434,8700,355,453,590,880,1200,1811)
df = cbind.data.frame(Date,AMOUNT)
df$Seasonal = rep(1:12)
df$Month = lubridate::month(df$Date)
df$Lag1 = data.table::shift(df$AMOUNT,1L,fill = df$AMOUNT[1],type = "lag")
df$Lag2 = data.table::shift(df$Lag1,1L,fill = df$AMOUNT[1],type = "lag")
Лучшие несколько строк из образца созданного образца данных: ![enter image description here](https://i.stack.imgur.com/lHimq.png)
Теперь я создаю модель LinearRegression следующим образом:
model_LR = lm(AMOUNT ~ Seasonal+Month+Lag1+Lag2,data=df)
И я создаю данные для прогнозирования будущего СУММА:
Date = seq(as.Date("2019-06-01"), as.Date("2019-10-01"), by="months")
Seasonal = rep(1:5)
future_df = cbind.data.frame(Date,Seasonal)
future_df$Month = lubridate::month(future_df$Date)
Как получить значения Lag для future_df, чтобы я мог использовать объект "model_LR" для прогнозирования будущего? Я могу выбрать значения из данных 2019-05 и 2019-04 для прогноза 2019-06 как значения запаздывания, но как мне включить это прогнозируемое значение в качестве значения запаздывания при прогнозировании на 2019-07 и последующие месяцы?