Я пытаюсь проверить гипотезу о двух категориальных переменных. Если я суммирую данные, это будет выглядеть так:
target
0 1
airbag 0 11129 669
1 13907 511
target: 0 означает, что человек жив после автомобильной аварии. 1 означает, что человек погиб во время аварии подушка безопасности: 0 означает, что подушки безопасности не было или она не сработала. 1 означает, что была открыта подушка безопасности.
Теперь я изложил свою гипотезу:
H0: Airbag vs no Airbag variables are independent.
H1: Airbag vs no Airbag variables are dependent.
Я попробовал это с помощью критерия Чисквэра, но получаю pvalue = 0.0, и я не уверенправильно ли я все делаю. Вот как выглядит мой код:
from scipy.stats import chisquare
chisquare([669, 511], f_exp = [11129,13907])
И вот результат:
Power_divergenceResult(statistic=22734.991970453277, pvalue=0.0)
Это нормально или я что-то не так делаю?
Спасибо зазаранее за любую помощь!