В настоящее время я работаю над проектом для домашних животных по прогнозированию будущих цен на базовую нефть на основе исторических цен на базовую нефть. Данные еженедельные, но между периодами отсутствуют цены.
Я в порядке с временными рядами моделирования с полными данными, но когда дело доходит до нерегулярных, те модели, которые я изучил, могут быть неприменимы. Использую ли я класс xts и продолжаю с моделями ARIMA в R обычным способом?
После построения модели для прогнозирования будущих цен я бы хотел учесть колебания цен на сырую нефть, рентабельность дизельного топлива, продажи автомобилей, экономический рост и т. Д. (Многовариантность?) Для повышения точности. Может кто-нибудь пролить свет на то, как мне сделать это эффективным способом? На мой взгляд, это похоже на лабиринт.
РЕДАКТИРОВАТЬ: Обрезанные данные здесь: https://docs.google.com/document/d/18pt4ulTpaVWQhVKn9XJHhQjvKwNI9uQystLL4WYinrY/edit
Кодировка:
Mod.fit<-arima(Y,order =c(3,2,6), method ="ML")
Результат:
Предупреждающее сообщение:
В журнале (s2): произведено NaN
Повлияет ли это предупреждение на точность моей модели?
С отсутствующими данными я не могу использовать ACF и PACF. Есть ли лучший способ выбора моделей? Я использовал AIC (информационный критерий Акаике) для сравнения различных моделей ARIMA с использованием этого кода. ARIMA (3,2,6) дал наименьший AIC.
Кодировка:
AIC<-matrix(0,6,6)
for(p in 0:5)
for(q in 0:5)
{
mod.fit<-arima(Y,order=c(p,2,q))
AIC[p+1,q+1]<-mod.fit$aic
p
}
AIC
Результат:
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] 1396.913 1328.481 1327.896 1328.350 1326.057 1325.063
[2,] 1343.925 1326.862 1328.321 1328.644 1325.239 1318.282
[3,] 1334.642 1328.013 1330.005 1327.304 1326.882 1314.239
[4,] 1336.393 1329.954 1324.114 1322.136 1323.567 1316.150
[5,] 1319.137 1321.030 1320.575 1321.287 1323.750 1316.815
[6,] 1321.135 1322.634 1320.115 1323.670 1325.649 1318.015