Перед многомерным авторегрессионным анализом я бы хотел провести тест ADF.Мои независимые переменные включают в себя:
Ежедневный объем Твиттера и две переменные лага:
- Ежедневный объем Твиттера (t-1)
- Ежедневный объем Твиттера (t-2)
Поскольку эти две переменные запаздывания включены в мой набор данных, я предположил, что лучше всего будет удалить первые две строки данных, поскольку пропущенные значения не разрешены в этом тесте?Далее несколько вещей мне не понятны:
Во-первых, мне не ясно, что означает порядок задержки при настройке теста.Например, при настройке теста ADF для переменной ежедневного объема Twitter (t-1), я должен заполнить '1' для порядка отставания, поскольку длина отставания составляет 1?
Во-вторых, я надеялся получить статистику теста (оценки Z (t)) и значение p, чтобы я мог сравнить их с критическими значениями теста ADF.Однако мне предоставляются только:
Увеличенный результат теста Дики-Фуллера
Time Series Tests for Variable: TW1
Values
Test(3) Augmented Dickey-Fuller
Altnernative Hypothesis (3) Stationary
P-Value(3) 0.01
Note(3) p-value smaller than printed p-value
Truncation Lag(3) 1
Расчеты, выполненные пакетом R tseries
Предупреждение: В adf.test (dta [, 1], altnernative = adfalth, k = adflagorder): значение p меньше, чем напечатанное значение p
IЯ не уверен, что подразумевается под напечатанным p-значением, задержкой усечения, предупреждающим сообщением и имеет ли этот результат какое-либо значение.Я надеюсь, что кто-то может помочь мне с настройкой теста и правильной интерпретацией результатов.