Проверка гипотезы 2 категориальных переменных - PullRequest
0 голосов
/ 26 октября 2019

Я пытаюсь проверить гипотезу о двух категориальных переменных. Если я суммирую данные, это будет выглядеть так:

               target
               0      1
 airbag   0  11129   669
          1  13907   511

target: 0 означает, что человек жив после автомобильной аварии. 1 означает, что человек погиб во время аварии подушка безопасности: 0 означает, что подушки безопасности не было или она не сработала. 1 означает, что была открыта подушка безопасности.

Теперь я изложил свою гипотезу:

H0: Airbag vs no Airbag variables are independent.

H1: Airbag vs no Airbag variables are dependent.

Я попробовал это с помощью критерия Чисквэра, но получаю pvalue = 0.0, и я не уверенправильно ли я все делаю. Вот как выглядит мой код:

from scipy.stats import chisquare
chisquare([669, 511], f_exp = [11129,13907])

И вот результат:

Power_divergenceResult(statistic=22734.991970453277, pvalue=0.0)

Это нормально или я что-то не так делаю?

Спасибо зазаранее за любую помощь!

...