Модель подходит, но ошибки прогнозов
Использование (4,0,13) модели ARIMA для следующих данных, показанных на рисунке ниже, дает плоские прогнозы (также показано на втором рисунке ниже).Я не уверен, почему модель может соответствовать данным в обучающем наборе, но потом ничего не прогнозировать.Я нашел другой вопрос здесь , в котором говорилось, что мне нужно добавить сезонный компонент.Ниже подробно описан мой опыт.
Временной ряд (увеличенный)
Предсказания *
*График прогнозов показывает все данные обучения, а также данные проверки после оранжевой вертикальной линии.Подход к обучению округляется до целых чисел (в этом наборе данных не может быть действительных чисел).Обратите внимание, что прогноз просто плоский и затем умирает.
Определение проблемы
У меня есть 15-минутный интервал данных и я хочу применить модель SARIMA к нему.Это имеет ежедневную сезонность, которая определяется с 7 утра до 9 вечера (следовательно, каждые 4 * 15 = 60 периодов (4, 15-минутные периоды в час * 15 часов)).Сначала я проверил стационарность с помощью теста Аугментированного Дики-Фуллера.Это прошло, и поэтому я начал анализировать ACF и PACF для определения параметров SARIMA.
Определение параметров
(p, d, q)
ACF& PACF для исходных данных
Исходя из этого, я вижу, что нет единичного корня (сумма ACF и PACF не равна 1), и что нам нужно различие в серии, поскольку нет большого сокращениявыключено в ACF.
ACF & PACF для дифференциальных данных
Исходя из этого, я вижу, что оно немного переопределено, поэтому я могу попробовать не использовать интегрированный термин и добавитьAR термин в 15 (точка, в которой ACF в исходном графике входит в полосы).Я также добавляю сюда термин MA.
(P, D, Q) s
Теперь я ищу сезонный компонент.Я делаю сезонную разницу в период 60, так как именно там на графике наблюдается всплеск.
Сезонная разница
Учитывая это, я должен добавить 2 МА условия к сезонному компоненту (Правила 13 и 7 с здесь ) Но сайттакже говорит, что обычно не следует использовать более 1 сезонной скользящей средней, поэтому я оставляю ее на 1.
Модель
Это оставляет мне САРИМУ (0,1,1) (0,1,1,60) модель.Однако у меня не хватает памяти, чтобы уместить эту модель (Python, используя функцию statsmodels
SARIMA).
Вопрос
Правильно ли я выбрал параметры?Являются ли эти данные пригодными для ARIMA / SARIMA?И, наконец, сработает ли SARIMA 60-го периода, и мне просто нужно найти способ запустить его на другой машине?
Наверное, вопрос tl; dr: что я делаю неправильно?
Не стесняйтесь вдаваться в детали.Я хочу быть в курсе временных рядов, поэтому больше информации лучше!