Это, вероятно, тривиально, но у меня есть проблема с интерпретацией модели ARMA и аналогичной модели AR, когда часть MA равна 0. Рассмотрим следующий пример, где я сравниваю модель ARMA с 1 AR, без разности и без MA деталь с простой моделью AR от lm
.
require(urca, forecast)
data(npext, package="urca")
npext$unemrate <- exp(npext$unemploy) # compute unemployment rate
L <- ts(npext, start=1860) # time series of levels
D <- diff(L) # time series of diffs
S <- window(ts.intersect(L,D), start=1909) # select same sample as Hansen's
SS <- data.frame(S)
sarima <- forecast::Arima(y = SS$L.gnpperca,
xreg= SS$D.unemrate,
order = c(1, 0, 0),
seasonal = c(0, 0, 0)
)
lmod <- lm(SS$L.gnpperca ~ c(NA,head(SS$L.gnpperca, -1)) + SS$D.unemrate)
Две модели дают очень разные оценки:
summary(sarima)
Series: SS$L.gnpperca
Regression with ARIMA(1,0,0) errors
Coefficients:
ar1 intercept xreg
0.9968 7.7908 -0.011
s.e. 0.0044 0.6008 0.002
sigma^2 estimated as 0.002731: log likelihood=121.62
AIC=-235.24 AICc=-234.7 BIC=-225.71
Training set error measures:
ME RMSE MAE MPE MAPE MASE ACF1
Training set 0.01600339 0.05126788 0.03735809 0.1996606 0.4936157 0.7901565 0.5590681
summary(lmod)
Call:
lm(formula = SS$L.gnpperca ~ c(NA, head(SS$L.gnpperca, -1)) +
SS$D.unemrate)
Residuals:
Min 1Q Median 3Q Max
-0.111898 -0.010954 0.001382 0.012774 0.050954
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.002251 0.046978 0.048 0.962
c(NA, head(SS$L.gnpperca, -1)) 1.001900 0.006077 164.875 <0.0000000000000002 ***
SS$D.unemrate -0.021589 0.001088 -19.840 <0.0000000000000002 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.02384 on 76 degrees of freedom
(1 observation deleted due to missingness)
Multiple R-squared: 0.9972, Adjusted R-squared: 0.9972
F-statistic: 1.374e+04 on 2 and 76 DF, p-value: < 0.00000000000000022
С более простой моделью AR1 лучше RMSE
sqrt(mean((SS$L.gnpperca - fitted(sarima))^2, na.rm = TRUE ))
[1] 0.05126788
sqrt(mean((lmod$model[,1] - fitted(lmod))^2, na.rm = TRUE ))
[1] 0.02337925
Я не понимаю, почему две модели не дают одинаковых результатов. Спасибо.