Я проверяю надежность подгонки аримы в R и пробовал следующую процедуру:
Я смоделировал 100 шагов процесса AR (1) с заданными параметрами и повторил его 1000 раз.Я беру среднее значение подгоночных параметров.
Я повторяю этот процесс 1000 раз, проверяю распределение средних подгоночных параметров и получаю следующие результаты.Как видите, правильные параметры находятся далеко за хвостом распределений.Форма распределения соответствует ожиданиям (нормальным, с прогнозируемой дисперсией), но, как представляется, существует систематический уклон недооценки среднего.
Является ли это проблемой в процессе подбора аримы или моделирования,или это проблема со статистикой, которую я не оцениваю?
nsim<-1e3
a<- 0.5
b<- 0.1
N<-1000
AR<-1:N
sigmas<-1:N
for (k in 1:N){
M<-replicate(nsim,arima.sim(list(ar=a),n=100,sd=b))
simulations<-list()
for (i in 1:nsim) simulations[[i]] <- arima(M[,i],order=c(1,0,0))
coefs1<-1:nsim
coefs2<-1:nsim
for (i in 1:nsim){
coefs1[i] <- simulations[[i]]$coef[2]
coefs2[i] <- simulations[[i]]$sigma2
}
AR[k]<-mean(coefs1)
sigmas[k]<-mean(coefs2)
cat(k, " "); flush.console()
}
plot(density(sigmas),main="Distribution of fitted sigma^2",xlab="sig2",xlim=c(0.0096,0.01005))
abline(v=0.01)
plot(density(AR),main="Distribution of fitted slopes",xlab="AR parameter",xlim=c(.46,0.505))
abline(v=0.5)[enter image description here][2]
[1]: https://i.stack.imgur.com/g04O3.jpg
[2]: https://i.stack.imgur.com/ygq3U.jpg