критерий хи-квадрат для независимости переменных с R - PullRequest
3 голосов
/ 03 марта 2012

Я должен сделать критерий хи-квадрат двух физических переменных с R. Я пытаюсь:

Library('MASS')
Library('gplots')
data<-read.table('data.dat',head=F) 
pp<-hist2d(data$V2,data$V3)
chisq.test(pp$counts)

, но R говорит мне:

Pearson's Chi-squared test

    data:  pp$counts 
    X-squared = NaN, df = 240, p-value = NA

Я использовалэтот скрипт в прошлом выполняет квадрат чи, но теперь он не работает.в чем проблема?

1 Ответ

3 голосов
/ 03 марта 2012

hist2d бункеров данных, но если некоторые из бинов всегда пустые, статистика хи-квадрат не определяется (из-за деления на ноль).Вы можете попытаться уменьшить количество корзин или отбросить пустые корзины.

library(gplots)
d <- data.frame( rnorm(100), rnorm(100) )

# Discard empty bins
p <- hist2d(d)
i <- apply( p$counts, 1, sum ) > 0
j <- apply( p$counts, 2, sum ) > 0
chisq.test( p$counts[i,j] )

# Reduce the number of bins
p <- hist2d(d,nbins=5)
chisq.test( p$counts )

(С точки зрения статистики я не уверен, что то, что вы делаете, является оптимальным.)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...