В glm.nb () дисперсия параметризована как ? + ? ^ 2 / ?, где ? - ваше среднее значение (подробнее см. в этом обсуждении ), а ? - тета, тогда как в пуассоне оно равно ϕ * ?
, где ϕ - дисперсия 5.53987, которую вы видите.
В отрицательном биноме дисперсия 1.069362
не будет иметь смысла, вам нужно взглянуть на тета внутри отрицательного бинома (), который в вашем случае равен 22,075. У меня нет ваших данных, но я использую ваш перехват как приблизительную оценку среднего значения:
mu = exp(4.914728)
theta = 22.0750109
variance = mu + (mu^2)/theta
variance
977.6339
variance / mu
[1] 7.173598
Что дает вам нечто похожее на дисперсию, которую вы. Вы должны заметить, что ваша дисперсия оценивается по полной модели, тогда как я просто угадал ее по вашему перехвату.
Итог - результаты не противоречат. Вы можете использовать отрицательный бином для моделирования ваших данных.
Ниже приведен пример, который иллюстрирует вышеуказанное соотношение. Мы моделируем чрезмерно рассредоточенные данные с использованием отрицательного бинома (это самое простое):
y = c(rnbinom(100,mu=100,size=22),rnbinom(100,mu=200,size=22))
x = rep(0:1,each=100)
AER::dispersiontest(glm(y~x,family=poisson))
Overdispersion test
data: glm(y ~ x, family = poisson)
z = 8.0606, p-value = 3.795e-16
alternative hypothesis: true dispersion is greater than 1
sample estimates:
dispersion
8.200214
Грубо говоря, это получается путем деления дисперсии в каждой группе на среднее значение в каждой группе:
mean(tapply(y,x,var)/tapply(y,x,mean))
[1] 8.283044
И Вы можете видеть, что дисперсия показывает 1, когда на самом деле ваши данные слишком раздроблены:
summary(MASS::glm.nb(y~x))
Call:
MASS::glm.nb(formula = y ~ x, init.theta = 21.5193965, link = log)
Deviance Residuals:
Min 1Q Median 3Q Max
-4.0413 -0.6999 -0.1275 0.5800 2.4774
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 4.66551 0.02364 197.36 <2e-16 ***
x 0.66682 0.03274 20.37 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Negative Binomial(21.5194) family taken to be 1)