Следует ли проводить перекрестную проверку модели временных рядов ARIMA / SARIMA с фиксированным pdq? - PullRequest
0 голосов
/ 08 мая 2020

Я пытаюсь найти, какова общая c модель временного ряда (ARIMA / SARIMA / ARIMAX / SARIMAX).

В качестве примера у меня есть модель однозначного временного ряда, которая читает данные из файла, а затем он проверяет лучшие значения (pdq). Затем с использованием лучших значений pdq создается окончательная модель. То же самое используется для получения прогноза на 12 месяцев. Я хочу проверить, насколько хороша модель, выполнив «оценку скользящего прогнозируемого источника» с многоэтапным прогнозированием на 12 месяцев. Как описано в https://otexts.com/fpp2/accuracy.html В настоящее время мы используем ту же модель для 12 итераций со скользящим окном. Например, первая итерация, тренировка с точками данных от 1 до 60 и периоды прогноза от 61 до 72. Период второй итерации - от 1 до 59, прогноз - от 60 до 71, и они продолжаются в течение 12 итераций. Затем мы вычисляем ошибку прогноза для всех этих прогнозов. У нас будет всего 12 (итерация) * 12 (многоступенчатый прогноз) = 144 ошибки прогноза. (Ошибка прогноза актуальна - значения прогноза)

Мы используем эти ошибки, чтобы проверить среднее значение и дисперсию, чтобы решить, насколько хорошо / надежно модель есть. У меня есть два вопроса при выполнении итеративного тестирования для другого временного окна: должны ли мы сохранять фиксированные значения pdq или они должны изменяться автоматически с помощью функции auto ARIMA в python. Второй вопрос заключается в том, как выбрать между двумя нижеприведенными… Когда обучать модель временных рядов (обучение означает сохранение фиксированных значений pdq, просто передавая новые значения в конце каждого месяца и обновляя модель) VS Создайте новую модель, проверив новый pdq значения и построить модель заново.

...