auto_arima возвращает лучшую модель как SARIMAX, даже если временной ряд является стационарным и не имеет сезонного компонента в Python - PullRequest
2 голосов
/ 17 февраля 2020

У меня есть набор данных временного ряда с частотой, равной ежедневной. Я проверил, что мой набор данных является стационарным, используя расширенный тест Дики-Фуллера.

После чего, когда я пытаюсь определить значения p, d, q, используя:

from pmdarima import auto_arima
stepwise_fit = auto_arima(df2['Births'],start_p=0,max_p=6, start_q=0, max_q=3, seasonal=False,trace=True)

Более того Я упомянул сезонный = False в аргументе auto_arima, но когда я это сделал:

stepwise_fit.summary()

Его возвращение:

SARIMAX Results
Dep. Variable:  y   No. Observations:   365
Model:  SARIMAX(1, 1, 1)    Log Likelihood  -1226.077
Date:   Mon, 17 Feb 2020    AIC 2460.154
Time:   20:02:17    BIC 2475.743
Sample: 0   HQIC    2466.350
- 365       
Covariance Type:    opg     
             coef   std err   z     P>|z|   [0.025  0.975]
intercept   0.0132  0.014   0.975   0.330   -0.013  0.040
ar.L1       0.1299  0.059   2.217   0.027   0.015   0.245
ma.L1      -0.9694  0.016   -62.235 0.000   -1.000  -0.939
sigma2      48.9989 3.432   14.279  0.000   42.273  55.725
Ljung-Box (Q):  36.69   Jarque-Bera (JB):   26.17
Prob(Q):        0.62    Prob(JB):   0.00
Heteroskedasticity (H): 0.97    Skew:   0.58
Prob(H) (two-sided):    0.85    Kurtosis:   3.62

Мы можем видеть, что оно возвращает Модель: SARIMAX (1, ​​1 1). Что мы можем из этого сделать? Любое предложение полезно, или если я что-то упустил.

1 Ответ

0 голосов
/ 18 февраля 2020

Я нашел причину, по которой показывается SARIMAX (1, ​​1, 1). Это просто означает ARIMA только потому, что формат SARIMAX в основном SARIMAX (p, d, q) (P, D, Q), где P, D, Q - сезонные параметры, поэтому в нашем случае SARIMAX (1,1 , 1) (0,0,0) сезонные компоненты равны нулю.

...