Почему такие большие степени свободы на некоторых уровнях в линейной модели смешанных эффектов? - PullRequest
1 голос
/ 16 апреля 2020

У меня есть данные о бюджете активности диких орангутанов, для которых я исследую, есть ли разница во времени, которое они проводят, питаясь, отдыхая и путешествуя до события лесного пожара и после пожара. Я использую линейную модель смешанных эффектов с минутами, потраченными на кормление в определенный день, в качестве моей переменной отклика (с количеством минут, в течение которых орангутанг не спит). Период пожара и возраст / пол являются фиксированными эффектами, а идентификация орангутана - случайным. У меня есть 2 уровня фактора fire_time («до» и «после»), 4 уровня фактора Age_Sex («SAF», «FM», «UFM», «подросток»), 47 орангутанов для случайного эффекта и всего 817 точек данных в этом наборе данных.

Мой фрейм данных выглядит следующим образом:

head(F)
   Follow_num Ou_name       Date  Month fire_time Age_Sex Primary_Act AP_obs minutesin24hr Perc_of_waking_day Perc_of_24hr
1        2029 Teresia 2011-10-04 Oct-11       pre     SAF     Feeding    625           310              49.60        21.53
5        2030 Teresia 2011-10-05 Oct-11       pre     SAF     Feeding    610           285              46.72        19.79
9        2032 Teresia 2011-10-09 Oct-11       pre     SAF     Feeding    620           340              54.84        23.61
13       2034 Teresia 2011-10-11 Oct-11       pre     SAF     Feeding    670           405              60.45        28.13
17       2038  Victor 2011-10-27 Oct-11       pre      FM     Feeding    675           155              22.96        10.76
21       2040    Nero 2011-11-03 Nov-11       pre      FM     Feeding    640           295              46.09        20.49

Код для моей модели выглядит следующим образом:

library(lme4)

lmer(minutesin24hr ~ Age_Sex + fire_time + (1|Ou_name), data = F, offset = AP_obs, REML = TRUE, na.action = "na.fail")

Когда я запускаю В этой модели используется пакет lmerTest для проверки степеней свободы и значений p. Кажется, у меня очень большие степени свободы для значимых уровней (см. Age_SexSAF и fire_timepre).

lmerTestmodel <- lmerTest::lmer(minutesin24hr ~ Age_Sex + fire_time + (1|Ou_name), data = F, offset = AP_obs, REML = TRUE, na.action = "na.fail")

REML criterion at convergence: 9370.7
Scaled residuals:
Min      1Q  Median      3Q     Max
-3.8955 -0.6304  0.1006  0.7141  2.3109 

Random effects:
Groups   Name        Variance Std.Dev.
Ou_name  (Intercept) 1636     40.44   
Residual             5460     73.89   
Number of obs: 817, groups:  Ou_name, 47

Fixed effects:
             Estimate Std. Error       df t value Pr(>|t|)    
(Intercept)  -188.614     14.711   26.765 -12.821 6.14e-13 ***
Age_SexFM     -20.297     17.978   24.696  -1.129   0.2698    
Age_SexSAF    -25.670     11.799  318.473  -2.176   0.0303 *  
Age_SexUFM     12.925     22.806   27.319   0.567   0.5755    
fire_timepre  -29.558      6.214  709.117  -4.757 2.38e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
            (Intr) Ag_SFM A_SSAF A_SUFM
Age_SexFM   -0.741                     
Age_SexSAF  -0.505  0.374              
Age_SexUFM  -0.598  0.480  0.302       
fire_timepr -0.298 -0.015  0.149  0.034

Я представляю, что эти большие степени свободы делают значения p значительными, поэтому я скептически отношусь к модели. Почему я получаю такие большие степени свободы только на этих двух уровнях? В уровнях Age_SexSAF и fire_timepre больше данных, но мне это не кажется нормальным. Я планирую сообщать об оценке, доверительных интервалах и p-значениях в моей диссертации, но я обеспокоен сообщением, если эти степени свободы неверны.

Извинения, если это может быть наивным вопросом, я впервые отважился на модели со смешанными эффектами. Любой совет с благодарностью, спасибо!

...