Фон
Выполнение множественного линейного регрессионного анализа для набора данных, содержащего 21 временной ряд из 4 точек данных. Каждая точка данных представляет 9 переменных, которые могут описывать значение. 21 точка данных предназначена для гидрологических бассейнов.
Краткий пример структуры данных:
import pandas as pd
import numpy as np
import statsmodels.api as sm
from statsmodels.stats.diagnostic import acorr_ljungbox
x = np.random.randn(12, 4)
y = np.random.randn(12, 1)
df = pd.DataFrame(x, columns=["Var1","Var2","Var3","Var4"],index=[0,1,2,3,0,1,2,3,0,1,2,3])
x = sm.add_constant(x, prepend=False)
mod = sm.OLS(y, x)
res = mod.fit()
ljung = acorr_ljungbox(res.resid, lags=4)
print(ljung)
Результат:
(array([0.14947105, 1.28825745, 2.67626114, 2.71154252]), array([0.69904135, 0.52511987, 0.44427655, 0.60719634]))
Где вторая строка - это p-значения для определения наличия автокорреляции.
Вопрос:
Является ли этот подход с использованием теста коробки Юнга для проверки наличия автокорреляции в остатках множественных временных рядов в множественной регрессии?