Я пытаюсь оценить пригодность 10 обобщенных линейных смешанных моделей, которые я построил с использованием функции glmmTMB.
В моделях переменная отклика является бинарной (которая описывает, где встречается местоположение особи = 1 или нет = 0 в исследуемом типе растительности), пояснительными переменными являются сезон, место и тип местоположения. (независимо от того, являются ли люди вместе или нет) и случайный эффект, который соответствует идентичности пары людей. Полная модель написана следующим образом:
Mod <- glmmTMB (Veg1 ~ Type + Site * Season + (1 | Pairs), family = binomial, data = df)
Затем я считал, что самой экономной моделью является модель, в которой AICc <2 и наименьшее количество объясняющих переменных. Теперь я хотел бы оценить соответствие каждой модели. Поскольку переменная ответа является двоичной, я рассчитал частоту ошибок для каждой из моделей следующим образом: </p>
p <- predict (mod, type = "response")
pbin <- ifelse (p> 0.5,1,0)
error_rate <- length (which (pbin! = resp)) / length (pbin) * 100
Проблема в том, что я получаю одинаковую частоту ошибок для 10 моделей (15,6% для всех моделей), в то время как разница AICc очень велика (> 30000 между моделью с более крупным AIC и моделью с AICc = 0) , Может кто-нибудь помочь мне понять, что не так?