Почему я получаю разные значения перехвата с тем же набором данных и тем же пакетом? (Р) - PullRequest
0 голосов
/ 03 апреля 2020

Я делаю опрос, в котором я публикую c доступные данные и заново запускаю статистику, которую авторы сделали в первую очередь. Я наткнулся на эту статью, в которой работали вложенные смешанные модели с пакетом lme4. Когда я запускаю одни и те же модели, я получаю одинаковые оценки с одинаковыми диапазонами CI, за исключением перехвата. Я пытался масштабировать непрерывный предиктор, и это только ухудшало ситуацию. Я попытался установить модель с REML, ИСТИНА или ЛОЖЬ, и это также не помогло. Как и почему это может происходить ?? Подсказка: версии R различаются, и, возможно, версии пакетов, но я не думаю, что мои оценки перехвата должны go с 13,39 (результат автора) до 5,47 (мой результат).

Редактировать: Набор данных довольно большой, поэтому я выложу только заголовок

 Species      Island Lizard_ID Headbob_duration_sec Background_speed_mm.per.sec Average_background_speed_mm.per.sec Habitat_light.log
1 Anolis_cooki Puerto_Rico      P232             6.300000                    8.933370                            8.933370          2.082839
2 Anolis_cooki Puerto_Rico      P233             2.133333                    8.518135                            9.331636          2.541373
3 Anolis_cooki Puerto_Rico      P233             4.766667                   10.076557                            9.331636          2.541373
4 Anolis_cooki Puerto_Rico      P233             7.133333                    9.641858                            9.331636          2.541373
5 Anolis_cooki Puerto_Rico      P233             5.466667                    9.347104                            9.331636          2.541373
6 Anolis_cooki Puerto_Rico      P233             6.000000                    9.074527                            9.331636          2.541373

Вот модель, которую сделали авторы (и я):

library(lme4)

modDHB<-lmer(Headbob_duration_sec~Average_background_speed_mm.per.sec+
Habitat_light.log+
Island+(1|Lizard_ID)+(Average_background_speed_mm.per.sec+Habitat_light.log|Species),
na.action=na.omit,control=lmerControl(optimizer="bobyqa"))

Модель предсказывает продолжительность поведения ящерицы (голова боба) в зависимости от скорости фона, освещенности окружающей среды и острова, где наблюдалось животное. Он использует виды ящериц как случайный фактор с идентификатором ящерицы, вложенным в виды.

Я не уверен, какой оптимизатор использовали авторы, но я использовал bobyqa для предотвращения проблем с конверсией.

Вот мой вывод:

 summary(modDHB)
Linear mixed model fit by REML ['lmerMod']
Formula: Headbob_duration_sec ~ Average_background_speed_mm.per.sec +  
    Habitat_light.log + Island + (1 | Lizard_ID) + (Average_background_speed_mm.per.sec +  
    Habitat_light.log | Species)
Control: lmerControl(optimizer = "bobyqa")

REML criterion at convergence: 16746

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-3.4199 -0.3470 -0.0370  0.1199  9.7081 

Random effects:
 Groups    Name                                Variance  Std.Dev. Corr       
 Lizard_ID (Intercept)                         1.412e+01 3.75754             
 Species   (Intercept)                         7.099e+00 2.66442             
           Average_background_speed_mm.per.sec 1.444e-04 0.01202  -1.00      
           Habitat_light.log                   4.741e+00 2.17739  -0.74  0.74
 Residual                                      4.081e+01 6.38801             
Number of obs: 2490, groups:  Lizard_ID, 429; Species, 16

Fixed effects:
                                    Estimate Std. Error t value
(Intercept)                          5.47746    1.48225   3.695
Average_background_speed_mm.per.sec  0.05186    0.06082   0.853
Habitat_light.log                   -1.41167    0.73028  -1.933
IslandPuerto_Rico                    7.91151    1.27021   6.228

Correlation of Fixed Effects:
            (Intr) A___.. Hbtt_.
Avrg_bc__.. -0.356              
Hbtt_lght.l -0.597 -0.033       
IslndPrt_Rc -0.628  0.009  0.065
convergence code: 0
boundary (singular) fit: see ?isSingular

Как я уже сказал, все в порядке, кроме оценки перехвата, которая должна составлять 13,39.

1 Ответ

0 голосов
/ 03 апреля 2020

Некоторые вычисления имеют вероятностные c компоненты, поэтому решения могут быть разными, например, если начальные значения различаются.

...