Куда делся перехват? Разница между использованием Anova для оценки моделей, созданных из glmer.nb и glm.nb - PullRequest
1 голос
/ 16 марта 2019

Я провел исследование, чтобы оценить влияние химической обработки на поведение насекомых. Это исследование проводилось в течение двух разных лет, и дизайн исследования несколько отличался:

  • Год 1, я проверил реакцию насекомых на химическую обработку через 5 интервалов времени (= дата).
  • Год 2, я исследовал реакцию насекомых на химическую обработку через 4 интервала времени, но повторил эксперимент 4 раза (= повторить) в каждом интервале.

Я строил серию обобщенных линейных моделей с отрицательным биномиальным семейством (лучшее распределение для моего набора данных), чтобы проанализировать, привлекались ли насекомые к различным химическим обработкам. Я использую эти модели, потому что они позволяют мне включать дату и реплицировать как часть модели как фиксированные или случайные эффекты, и с большей вероятностью обнаруживать эффекты, чем тест Фридмана, который обычно используется для анализа данных, подобных моим.

Для данных первого года я использую обобщенные линейные модели для анализа моих данных по следующей формуле:

modelYear1 = glm.nb(insect.of.interest ~ treatment + date, data = data)

Затем я использую Anova для анализа значимости фиксированных эффектов в моей модели и получаю следующий вывод:

Anova(modelYear1, type = 3)

Analysis of Deviance Table (Type III tests)

Response: insect.of.interest
          LR Chisq Df Pr(>Chisq)   
treatment   9.0489  5   0.107131   
date       17.5317  4   0.001523 **
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Этот вывод отличается от того, что возвращается, если я проанализирую данные за второй год. Для данных за 2-й год я использую обобщенную линейную смешанную модель, чтобы я мог включить повторение в качестве случайного эффекта в соответствии со следующей моделью (это лучшая модель для моего набора данных):

modelYear2 = glmer.nb(insect.of.interest ~ treatment + date + (1 | replicate), data = data)

Использование Anova для анализа значимости фиксированных эффектов в моей модели дает несколько иной результат:

Anova(modelYear2, type = 3)

Analysis of Deviance Table (Type III Wald chisquare tests)

Response: insect.of.interest
              Chisq Df Pr(>Chisq)    
(Intercept)  2.2228  1     0.1360    
treatment    6.5543  4     0.1614    
date        67.9646  3  1.164e-14 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Мой главный вопрос ... куда делся перехват? Почему Anova сообщает о перехвате для моей модели glmer.nb, а не моей модели glm.nb? Что касается моей работы, я хотел бы сообщить о фиксированных эффектах всех моих моделей, независимо от того, было ли обнаружено, что они имеют существенные эффекты или нет. Модели со значимыми параметрами затем будут получать свои оценки из функции summary (). Функция сводки выдает оценки для перехвата, но я смогу показать эти результаты до того, как сообщу о результатах суммирования.

Буду признателен за любые предложения о том, как решить эту проблему. Происходит ли что-то принципиально иное, когда я использую Anova, чтобы посмотреть на фиксированные эффекты glms и glmms?

...