Ошибка теста хи-квадрат "Аппроксимация хи-квадрат может быть неправильной" - PullRequest
0 голосов
/ 30 октября 2018

Я провел тест хи-квадрат в R и получил следующие результаты:

crianza = matrix(c(1,1,0,12,12,7,2,1,0,0,1,0,0,0,5,
      0,0,0,1,1,2,0,0,3,0,0,0,13,35,29,0,0,1,10,
      0,0,1,0,0,0,0,0),ncol=3,byrow=TRUE)
colnames (crianza) = c("Neonate","Juevenile","Adult")
rownames (crianza) = c("C.acronotus","C.limbatus","C.obscurus","C.perezi",
 "C.porosus","C.falciformis","G.cuvier","G.cirratum","M.canis",
 "R.porosus","R.lalandii","S.lewini","S.mokarran","S.tiburo")    
crianza = as.table(crianza)

Pearson's Chi-squared test

data:  crianza
X-squared = NaN, df = 26, p-value = NA

Warning message:
In chisq.test(crianza) : Chi-squared approximation may be incorrect

Кто-нибудь знает, почему он дал предупреждение? Это потому, что я использую неправильный метод?

1 Ответ

0 голосов
/ 30 октября 2018

Вы получаете NA значений, потому что у вас есть строки без подсчета вообще.

cc <- crianza[rowSums(crianza)>0,]
chisq.test(cc)

Чтобы обойти предупреждение, попробуйте simulate.p.value=TRUE:

chisq.test(cc, simulate.p.value=TRUE)

Обратите внимание, что это чрезвычайно несбалансированная таблица, с имитированными p-значениями вы, по сути, получите значение, равное 1 / (количество выполненных симуляций):

chisq.test(cc, simulate.p.value=TRUE, B=1e6)

Я дошел до B=1e7 до того, как мне хватило терпения. Вам, вероятно, не стоит беспокоиться о том, чтобы сообщать о значениях, превышающих «значение p очень мало, самое большее 1e-6»

...