Question

Я хочу проверить гипотезу, что «intercept = 0, beta = 1», поэтому я должен сделать тест Wald и использовать модуль «statsmodel.formula.api».

Но я не уверен, какой код правильный при выполнении теста Вальда.

from statsmodels.datasets import longley
import statsmodels.formula.api as smf
data = longley.load_pandas().data

hypothesis_0 = '(Intercept = 0, GNP = 0)'
hypothesis_1 = '(GNP = 0)'
hypothesis_2 = '(GNP = 1)'
hypothesis_3 = '(Intercept = 0, GNP = 1)'
results = smf.ols('TOTEMP ~ GNP', data).fit()
wald_0 = results.wald_test(hypothesis_0)
wald_1 = results.wald_test(hypothesis_1)
wald_2 = results.wald_test(hypothesis_2)
wald_3 = results.wald_test(hypothesis_3)

print(wald_0)
print(wald_1)
print(wald_2)
print(wald_3)

results.summary()

Сначала я думал, что гипотеза_3 верна.

Но результат гипотезы_1 совпадает с F-тестом регрессии, который показывает, что гипотеза «перехват = 0 и бета = 0».

Итак, я подумал, что модуль 'wald_test' установил 'intercept = 0' по умолчанию.

Я не уверен, какой из них правильный.

Не могли бы вы дать мне ответ, какой из них правильный?

Josef · Answer 1 · 01 мая 2018

Гипотеза 3 является правильной совместной нулевой гипотезой для теста Вальда. Гипотеза 1 совпадает с F-тестом в итоговом выводе, который является гипотезой, что все коэффициенты наклона равны нулю.

Я изменил пример для использования искусственных данных, чтобы мы могли видеть влияние различных «истинных» бета-коэффициентов.

import numpy as np
import pandas as pd
nobs = 100
np.random.seed(987125)
yx = np.random.randn(nobs, 2)
beta0 = 0
beta1 = 1
yx[:, 0] += beta0 + beta1 * yx[:, 1]
data = pd.DataFrame(yx, columns=['TOTEMP', 'GNP'])

hypothesis_0 = '(Intercept = 0, GNP = 0)'
hypothesis_1 = '(GNP = 0)'
hypothesis_2 = '(GNP = 1)'
hypothesis_3 = '(Intercept = 0, GNP = 1)'
results = smf.ols('TOTEMP ~ GNP', data).fit()
wald_0 = results.wald_test(hypothesis_0)
wald_1 = results.wald_test(hypothesis_1)
wald_2 = results.wald_test(hypothesis_2)
wald_3 = results.wald_test(hypothesis_3)

print('H0:', hypothesis_0)
print(wald_0)
print()
print('H0:', hypothesis_1)
print(wald_1)
print()
print('H0:', hypothesis_2)
print(wald_2)
print()
print('H0:', hypothesis_3)
print(wald_3)

В этом случае при бета0 = 0 и бета1 = 1 обе гипотезы 2 и 3 верны. Гипотеза 0 и 1 не соответствует моделируемым данным.

Результаты теста Уолда отклоняют ложные и не отвергают истинные гипотезы, поскольку размер выборки и размер эффекта должны приводить к высокой мощности.

H0: (Intercept = 0, GNP = 0)
<F test: F=array([[ 58.22023709]]), p=2.167936332972888e-17, df_denom=98, df_num=2>

H0: (GNP = 0)
<F test: F=array([[ 116.33149937]]), p=2.4054199668085043e-18, df_denom=98, df_num=1>

H0: (GNP = 1)
<F test: F=array([[ 0.1205935]]), p=0.7291363441993846, df_denom=98, df_num=1>

H0: (Intercept = 0, GNP = 1)
<F test: F=array([[ 0.0623734]]), p=0.9395692694166834, df_denom=98, df_num=2>

Аналогичные результаты можно проверить, изменив бета0 и бета1.

Как я могу сделать тест Wald в Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как я могу сделать тест Wald в Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы