В последнее время я работаю с данными временных рядов.Я много исследовал, но не нашел кого-то, кто позаботится об этой (очень простой) проблеме.
Скажем, у меня есть данные за период от t=8
до t=50
.Я использую лаг 1,2 и 7, потому что это ежедневные данные, и мне нужно делать 7-дневные прогнозы.Итак, я тренирую свою модель с данными от t=8
до t=43
, чтобы прогнозировать от t=44
до t=50
.
Итак, мои данные поезда выглядят так:
t Q Q_lag1 Q_lag2 Q_lag7
8 10 11 12 9
9 14 10 11 8
. . . . .
. . . . .
. . . . .
43 25 24 22 20
Здесь нет проблем.Я могу обучить мою модель, Q y_train
, а остальные столбцы X_train
.Но затем, если я хочу проверить свою модель для прогнозирования, если я сделаю что-то вроде этого:
forecast= clf.predict(X_test)
Я буду использовать данные, которые на практике я не буду знать.
Скажите,для прогнозирования значения Q в t=48
мне нужны данные из лагов 1, лагов 2 и лагов 7, то есть t=47
, t=46
и t=40
, но на практике у меня будут данные только до t=43
что означает, что мне нужно использовать прогнозы из t=47
и t=46
вместо фактических значений.
Это должно быть довольно стандартным, но не может найти людей, которые обращаются к нему.Знаете ли вы, как я могу рекурсивно заменить мои данные X_test на прогнозы?