Как отформатировать таблицу и / или хи-квадрат для проверки значимости среди категориальных переменных - PullRequest
0 голосов
/ 21 мая 2019

У меня есть этот набор данных, в котором я хочу сравнить переменные, чтобы увидеть, значимы ли какие-либо группы по различным категориальным переменным.Когда я использую следующий код, R возвращает предупреждающее сообщение о том, что значение p может быть неправильным.Я неправильно форматирую хи-квадрат?

df<-(group, gender, race, handedness
1, 0, 3, 0
1, 1, 3, 1
2, 1, 3, 0
2, 1, 3, 0
3, 0, 2, 1
3, 0, 2, 0)

# Is Gender significant among groups
gendertab<-table(df$gender, df$group)
chisq.test(gendertab)
# Is Race significant
racetab<-table(df$race, df$group)
chisq.test(racetab)
# Is Handedness significant
handtab<-table(df$handedness, df$group)
chisq.test(handtab)

1 Ответ

0 голосов
/ 21 мая 2019

Попробуйте аргумент simulate.p.value = TRUE и сравните результаты с fisher.test ( R справочная страница или Википедия ). Кажется, они согласны друг с другом.

# Is Gender significant among groups
gendertab<-table(df$gender, df$group)
fisher.test(gendertab)
chisq.test(gendertab, simulate.p.value = TRUE)

# Is Race significant
racetab<-table(df$race, df$group)
fisher.test(racetab)
chisq.test(racetab, simulate.p.value = TRUE)

# Is Handedness significant
handtab<-table(df$handedness, df$group)
fisher.test(handtab)
chisq.test(handtab, simulate.p.value = TRUE)

Данные.

df <- read.csv(text = "
group, gender, race, handedness
     1, 0, 3, 0
     1, 1, 3, 1
     2, 1, 3, 0
     2, 1, 3, 0
     3, 0, 2, 1
     3, 0, 2, 0")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...