Разве ARMA (1, 0, 0) не должен давать тот же результат, что и модель AR (1)? - PullRequest
0 голосов
/ 20 апреля 2020

Это, вероятно, тривиально, но у меня есть проблема с интерпретацией модели ARMA и аналогичной модели AR, когда часть MA равна 0. Рассмотрим следующий пример, где я сравниваю модель ARMA с 1 AR, без разности и без MA деталь с простой моделью AR от lm.

require(urca, forecast)
data(npext, package="urca")
npext$unemrate <- exp(npext$unemploy)      # compute unemployment rate
L <- ts(npext, start=1860)                 # time series of levels
D <- diff(L)                               # time series of diffs
S <- window(ts.intersect(L,D), start=1909) # select same sample as Hansen's
SS <- data.frame(S)

sarima <- forecast::Arima(y = SS$L.gnpperca, 
                          xreg= SS$D.unemrate, 
                          order = c(1, 0, 0),
                          seasonal = c(0, 0, 0)
)

lmod <- lm(SS$L.gnpperca ~ c(NA,head(SS$L.gnpperca, -1)) + SS$D.unemrate)

Две модели дают очень разные оценки:

summary(sarima)
Series: SS$L.gnpperca 
Regression with ARIMA(1,0,0) errors 

Coefficients:
         ar1  intercept    xreg
      0.9968     7.7908  -0.011
s.e.  0.0044     0.6008   0.002

sigma^2 estimated as 0.002731:  log likelihood=121.62
AIC=-235.24   AICc=-234.7   BIC=-225.71

Training set error measures:
                     ME       RMSE        MAE       MPE      MAPE      MASE      ACF1
Training set 0.01600339 0.05126788 0.03735809 0.1996606 0.4936157 0.7901565 0.5590681

summary(lmod)

Call:
lm(formula = SS$L.gnpperca ~ c(NA, head(SS$L.gnpperca, -1)) + 
    SS$D.unemrate)

Residuals:
      Min        1Q    Median        3Q       Max 
-0.111898 -0.010954  0.001382  0.012774  0.050954 

Coefficients:
                                Estimate Std. Error t value            Pr(>|t|)    
(Intercept)                     0.002251   0.046978   0.048               0.962    
c(NA, head(SS$L.gnpperca, -1))  1.001900   0.006077 164.875 <0.0000000000000002 ***
SS$D.unemrate                  -0.021589   0.001088 -19.840 <0.0000000000000002 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.02384 on 76 degrees of freedom
  (1 observation deleted due to missingness)
Multiple R-squared:  0.9972,    Adjusted R-squared:  0.9972 
F-statistic: 1.374e+04 on 2 and 76 DF,  p-value: < 0.00000000000000022

С более простой моделью AR1 лучше RMSE

sqrt(mean((SS$L.gnpperca - fitted(sarima))^2, na.rm = TRUE ))
[1] 0.05126788
sqrt(mean((lmod$model[,1] - fitted(lmod))^2, na.rm = TRUE ))
[1] 0.02337925

Я не понимаю, почему две модели не дают одинаковых результатов. Спасибо.

...