В статье: Оценка глобальной осведомленности о ХОБЛ с помощью Google Trends https://www.researchgate.net/publication/333155916_Assessing_global_COPD_awareness_with_Google_Trends
Я нашел следующее описание статистического анализа:
Для статистического анализа мы разделили данные намесяцы (сезонная составляющая) и кварталы года, которые были определены следующим образом: 1 квартал (1 квартал) = январь - март, 2 квартал (2 квартал) = апрель - июнь, 3 квартал (3 квартал) = июль - сентябрь, 4 квартал (Q4) = октябрь - декабрь.Корреляционный анализ проводился с использованием сезонной декомпозиции временных рядов по Лесс (фитинг локальной полиномиальной регрессии), который позволяет разложить временные ряды на сезонные части, тренды и нерегулярные компоненты. Обобщенная модель наименьших квадратов, учитывающая автокорреляцию между остатками, была установлена для дальнейшей оценки значимости тренда во времени после корректировки на сезонные компоненты.Корреляционная структура невязок была получена из автоматического выбора параметров модели ARIMA с использованием критерия AIC .
Данные были выражены в виде коэффициента (бета), стандартной ошибки и значения p.
Полностью не разбираюсь в выделенном фрагменте.Я подготовил некоторый код для подготовки модели ARIMA на основе данных временного ряда.Однако я не знаю процесс расчета автокорреляции.
Давайте посмотрим код:
library(forecast)
data(AirPassengers)
model_arima<- auto.arima(y=AirPassengers,seasonal=TRUE,stepwise=TRUE)
model_arima
Series: AirPassengers
ARIMA(2,1,1)(0,1,0)[12]
Coefficients:
ar1 ar2 ma1
0.5960 0.2143 -0.9819
s.e. 0.0888 0.0880 0.0292
sigma^2 estimated as 132.3: log likelihood=-504.92
AIC=1017.85 AICc=1018.17 BIC=1029.35
... и как должен выглядеть следующий шаг для получения результатов автокорреляции, как в вышеупомянутой статье?