Порядок случайных эффектов вводится в модель влияет на оценки - PullRequest
0 голосов
/ 01 октября 2018

При настройке линейной смешанной модели порядок ввода переменных в модель (как случайных и фиксированных), по-видимому, влияет на оценки, которые я получаю из модели.В настройке OLS это не так.

Может ли кто-нибудь объяснить, почему результирующие предполагаемые фиксированные эффекты меняются, когда я либо меняю порядок, в котором фиксированные эффекты входят в модель, либо порядок случайных эффектов?Потому что я не вижу, чем

lmer(Y ~ X1 + X2 + (1 + X1 + X2 | f) )

отличается от

lmer(Y ~ X2 + X1 + (1 + X2 + X1 | f) )

Ниже приведен короткий пример.

library(lme4)

lmer1 <- lmer(Sepal.Length ~ 1 + Sepal.Width + Petal.Length +
Petal.Width  + (1 + Sepal.Width + Petal.Length + Petal.Width  |
Species), data=iris)

lmer2 <- lmer(Sepal.Length ~ 1 + Sepal.Width +
Petal.Length + Petal.Width  + (1 + Petal.Width + Sepal.Width +
Petal.Length  | Species), data=iris)

lmer3 <- lmer(Sepal.Length ~ 1 +
Petal.Width + Sepal.Width + Petal.Length + (1 + Petal.Width +
Sepal.Width + Petal.Length  | Species), data=iris)

fixef(lmer1)
fixef(lmer2)
fixef(lmer3)[c("(Intercept)",  "Sepal.Width", "Petal.Length",  "Petal.Width")]

Выходные данные этих трех, казалось бы, идентичных моделейпредставлен ниже:

> fixef(lmer1)
 (Intercept)  Sepal.Width Petal.Length  Petal.Width 
   1.6707431    0.4711415    0.7266866   -0.2240361 
> fixef(lmer2)
 (Intercept)  Sepal.Width Petal.Length  Petal.Width 
   1.6707432    0.4711417    0.7266866   -0.2240366 
> fixef(lmer3)[c("(Intercept)",  "Sepal.Width", "Petal.Length",  "Petal.Width")]
 (Intercept)  Sepal.Width Petal.Length  Petal.Width 
   1.6707428    0.4711414    0.7266866   -0.2240358 

Теперь, хотя предполагаемые фиксированные эффекты настолько схожи, что различие между ними вряд ли будет иметь какое-либо практическое значение, все же заставляет меня задуматься, почему это происходит.

1 Ответ

0 голосов
/ 02 октября 2018

Как указано в комментарии к моему исходному сообщению, выясняется, что это известная ошибка пакета lme4;см. https://github.com/lme4/lme4/issues/449. Надеюсь, это будет решено в следующих выпусках пакета.Я благодарю Димитриса Ризопулоса за предоставление этой информации.

Кроме того, оказывается, что порядок строк в наборе данных также влияет на оценки аналогичным образом: блеск в R: оценки значимости не являютсяустойчивый к порядку фрейма данных

Другими словами, то, как мы вводим переменные в lmer и в каком порядке располагаются строки набора данных, в настоящее время влияет на оценки.Надеюсь, что эти проблемы могут быть решены в будущем, поскольку, на мой взгляд, это не очень привлекательное свойство для статистического инструмента.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...