Я борюсь с кодом для модели смешанных эффектов, в которой случайный эффект вложен в случайный эффект, вложенный в фиксированный эффект. Я читал множество других вопросов / руководств и экспериментировал с несколькими моделями, но синтаксис продолжает сбивать меня с толку.
Базовый дизайн c таков: исследование проводилось по двум регионам за два года. В каждом регионе было три участка отбора проб и три участка в каждом участке. Каждый график отбирался один раз в год для каждого из двух лет. Таким образом, сюжет вложен в сайт, который вложен в регион. Я хочу знать, различаются ли эти два региона, различаются ли два года и есть ли взаимодействие.
Вот простой набор фиктивных данных для работы с
region <- c("a","a","a","a","a","a","a","a","a","b","b","b","b","b","b","b","b","b","a","a","a","a","a","a","a","a","a","b","b","b","b","b","b","b","b","b")
site <- c("c","c","c","d","d","d","e","e","e","f","f","f","g","g","g","h","h","h","c","c","c","d","d","d","e","e","e","f","f","f","g","g","g","h","h","h")
plot <- c("i","j","k","l","m","n","o","p","q","r","s","t","u","v","w","x","y","z","i","j","k","l","m","n","o","p","q","r","s","t","u","v","w","x","y","z")
year <- c("AA","AA","AA","AA","AA","AA","AA","AA","AA","AA","AA","AA","AA","AA","AA","AA","AA","AA","BB","BB","BB","BB","BB","BB","BB","BB","BB","BB","BB","BB","BB","BB","BB","BB","BB","BB")
response <- c(4,5,6,7,8,9,4,5,7,7,5,6,8,9,10,11,12,10,5,6,8,8,9,10,5,6,7,6,6,7,9,10,11,12,13,10)
data <- cbind.data.frame(region,site,plot,year,response)
Вот несколько моделей, которые я пробовал, а затем объяснение, почему они меня смущают и почему я не уверен, с какой из них правильно.
m1 <- lmer(response~year*region+(1|region/site/plot),data = data)
Anova(m1)
m2 <- lmer(response~year*region+(1|region:site:plot),data = data)
Anova(m2)
m3 <- lmer(response~year*region+(1|region:site)+(1|region:plot),data = data)
Anova(m3)
m4 <- lmer(response~year*region+(1|region:site)+(1|site:plot),data = data)
Anova(m4)
m5 <- lmer(response~year*region+(1|region:site),data = data)
Anova(m5)
m6 <- lmer(response~year*region+(1|site:plot),data = data)
Anova(m6)
m1 выдает предупреждения и кажется неправильным синтаксисом для lmer (это правильно?)
Текущая сводка (m2) предполагает, что m2 обрабатывает область: site: plot как единое целое, что, по сути, приводит к 18 уникальным точкам, что неверно и заставляет меня думать, что эта структура модели неверна. Однако я сбит с толку, потому что m6 дает тот же результат от Anova (), а summary () такой же, за исключением некоторых меток. Как это возможно? В m6 R автоматически определяет, что сайт вложен в регион, что дает тот же результат? Если да, то какой смысл указывать вложение?
m3 и m4 дают идентичные результаты, что заставляет меня думать, что это правильный синтаксис, поскольку они оба, похоже, помещают график внутри сайта, а сайт в регион (на основе summary ())
m5 очень сбивает с толку, потому что результаты для региона такие же, как m3 или m4 (год и взаимодействие различаются), даже если график не был указан как вложенный ни под что. Как регион остается таким же, если к сюжету относятся иначе? Несомненно, способ разделения дисперсии должен отличаться: m5 рассматривает каждое измерение на участке как независимое, в то время как m3 и m4 правильно понимают, что измерения сгруппированы в графики.
Любая помощь относительно того, какая из этих моделей верна / Мы будем очень признательны, почему это правильно (или если есть еще одна модель, которая действительно верна).
Наконец, я бы предпочел год как случайный перехват. Правильно ли я, что для этого я просто заменил все «(1 |» в окончательной модели на «(год |»?
Спасибо