Я строю модель линейной регрессии для временного ряда, используя в качестве признаков запятую переменную (x_t-1,x_t-2,xt-3...x_t-k)
, где k
- это параметр, который я могу установить.
Таким образом, целевая переменная xt (or x_t-0)
и предикторами являются все k
отстающие переменные. Я обучил регрессионную модель и проверил прогнозы на основе набора тестов.
Теперь я могу sh составлять прогнозы для данных, которые не входят в мои временные ряды, начиная с последней даты этого временного ряда до данная дата.
Чтобы достичь этого, я подумал о создании нового фрейма данных, где первая строка - это последняя строка моего отстающего фрейма данных, а затем мне нужно добавить новые строки после этой логики c:
В строке 1: xt
- новое прогнозируемое значение, x(t-1).... x(t-k)
совпадают с последней строкой в отсроченном кадре данных.
В строке 2: X(t)
- это новое прогнозируемое значение с использованием r ow(1), x(t-1) is x(t) of row 1, x(t-2) is x(t-from row 1 ...etc
В строке 3: X(t)
- это новое прогнозируемое значение с использованием row(2), x(t-1) is x(t) from row 2, x(t-2) is x(t-1) from row 2 ...etc
И повторите этот процесс для прогноза n_days, поэтому в конце нового фрейма данных у меня будет n строк.
Я не могу придумать код, использующий pandas, чтобы сделать это, я всегда повторяю одни и те же значения в каждой строке, поэтому я был бы очень признателен за помощь.