Я делаю опрос, в котором я публикую c доступные данные и заново запускаю статистику, которую авторы сделали в первую очередь. Я наткнулся на эту статью, в которой работали вложенные смешанные модели с пакетом lme4. Когда я запускаю одни и те же модели, я получаю одинаковые оценки с одинаковыми диапазонами CI, за исключением перехвата. Я пытался масштабировать непрерывный предиктор, и это только ухудшало ситуацию. Я попытался установить модель с REML
, ИСТИНА или ЛОЖЬ, и это также не помогло. Как и почему это может происходить ?? Подсказка: версии R различаются, и, возможно, версии пакетов, но я не думаю, что мои оценки перехвата должны go с 13,39 (результат автора) до 5,47 (мой результат).
Редактировать: Набор данных довольно большой, поэтому я выложу только заголовок
Species Island Lizard_ID Headbob_duration_sec Background_speed_mm.per.sec Average_background_speed_mm.per.sec Habitat_light.log
1 Anolis_cooki Puerto_Rico P232 6.300000 8.933370 8.933370 2.082839
2 Anolis_cooki Puerto_Rico P233 2.133333 8.518135 9.331636 2.541373
3 Anolis_cooki Puerto_Rico P233 4.766667 10.076557 9.331636 2.541373
4 Anolis_cooki Puerto_Rico P233 7.133333 9.641858 9.331636 2.541373
5 Anolis_cooki Puerto_Rico P233 5.466667 9.347104 9.331636 2.541373
6 Anolis_cooki Puerto_Rico P233 6.000000 9.074527 9.331636 2.541373
Вот модель, которую сделали авторы (и я):
library(lme4)
modDHB<-lmer(Headbob_duration_sec~Average_background_speed_mm.per.sec+
Habitat_light.log+
Island+(1|Lizard_ID)+(Average_background_speed_mm.per.sec+Habitat_light.log|Species),
na.action=na.omit,control=lmerControl(optimizer="bobyqa"))
Модель предсказывает продолжительность поведения ящерицы (голова боба) в зависимости от скорости фона, освещенности окружающей среды и острова, где наблюдалось животное. Он использует виды ящериц как случайный фактор с идентификатором ящерицы, вложенным в виды.
Я не уверен, какой оптимизатор использовали авторы, но я использовал bobyqa для предотвращения проблем с конверсией.
Вот мой вывод:
summary(modDHB)
Linear mixed model fit by REML ['lmerMod']
Formula: Headbob_duration_sec ~ Average_background_speed_mm.per.sec +
Habitat_light.log + Island + (1 | Lizard_ID) + (Average_background_speed_mm.per.sec +
Habitat_light.log | Species)
Control: lmerControl(optimizer = "bobyqa")
REML criterion at convergence: 16746
Scaled residuals:
Min 1Q Median 3Q Max
-3.4199 -0.3470 -0.0370 0.1199 9.7081
Random effects:
Groups Name Variance Std.Dev. Corr
Lizard_ID (Intercept) 1.412e+01 3.75754
Species (Intercept) 7.099e+00 2.66442
Average_background_speed_mm.per.sec 1.444e-04 0.01202 -1.00
Habitat_light.log 4.741e+00 2.17739 -0.74 0.74
Residual 4.081e+01 6.38801
Number of obs: 2490, groups: Lizard_ID, 429; Species, 16
Fixed effects:
Estimate Std. Error t value
(Intercept) 5.47746 1.48225 3.695
Average_background_speed_mm.per.sec 0.05186 0.06082 0.853
Habitat_light.log -1.41167 0.73028 -1.933
IslandPuerto_Rico 7.91151 1.27021 6.228
Correlation of Fixed Effects:
(Intr) A___.. Hbtt_.
Avrg_bc__.. -0.356
Hbtt_lght.l -0.597 -0.033
IslndPrt_Rc -0.628 0.009 0.065
convergence code: 0
boundary (singular) fit: see ?isSingular
Как я уже сказал, все в порядке, кроме оценки перехвата, которая должна составлять 13,39.