Сравнение двух категориальных переменных - PullRequest
1 голос
/ 11 мая 2019

У меня есть две категориальные переменные (пол и здоровье).Пол может принимать значения как мужчины, так и женщины, тогда как здоровье может принимать значения 1, 2, 3, 4, 5 в зависимости от уровня здоровья (1 менее здоров, 2 лучше здоров, чем 1, ..., 5 здоровее)

Для следующего набора данных мне нужно решить, здоровы ли женщины, чем мужчины.

See dataset

Я знаю, что для категориальных переменных есть критерий ChiSquare для разницы между двумя (или более) пропорциями и критерий независимости ChiSquare.Но похоже, что ни один из этих двух тестов не сможет сравнить две переменные.Посоветуйте пожалуйста как мне пройти для необходимого сравнения.

-Beejal

1 Ответ

0 голосов
/ 11 мая 2019

вам нужно создать 2 списка:

men = [45,70,178,92,26]
women = [36, 67, 329, 147, 20]

, затем вам нужно умножить первый номер списка на один, второй на два и так далее.вам также понадобятся две переменные, которые вы сравните позже

j = 0
men_health = 0
women_health = 0
for i in range (1,5):
    men_health = men_health + men[j] * i
    women_health = women_health + women[j] * i  
    j =+ 1

наконец вы сравните две переменные:

if men_health > women_health:
    print ("men are more healthy!")
elif men_health < women_health:
    print ("women are more healthy!")
...