Я работаю с набором данных, содержащим вложенные группы, и мне интересно, как правильно указать модель (ы).
Данные являются двоичными показателями того, согласован ли «Кодекс» Группой. В состоянии контроля 3 группы, а в условии лечения 3 группы.
Я пытаюсь смоделировать вероятности различных кодов, присутствующих в состоянии лечения.
Некоторые данные игрушек:
library(lme4)
Data <- rbind(data.frame(Code = rep(LETTERS[1:5],6),
Condition = rep("Control", 30),
Trial = rep(c(1:3), each = 5),
Group = rep(letters[1:3],10),
Present = sample(0:1, 30, replace = T)),data.frame(Code = rep(LETTERS[1:5],6),
Condition = rep("Treatment", 30),
Trial = rep(c(1:3), each = 5),
Group = rep(letters[4:6],10),
Present = sample(0:1, 30, replace = T)))
Дайте внутреннюю вложенность в данные, можно ли указать модель как:
Mod1 <- glmer(Present ~ Condition * Code + (1|Group), family=binomial(link = "logit"), data = Data)
Или мне нужно указать вложенность что-то вроде:
Mod2<- glmer(Present ~ Condition * Code + (1|Condition/Group), family=binomial(link = "logit"), data = Data)
Я не уверен, какая модель соответствует дизайну, и я видел противоречивые сообщения об использовании /
против :
, поэтому мне не ясно, правильно ли я указал вложение (в дополнение к тому, необходимо).
Данные примера малы, поэтому вторая модель выдает предупреждение о единственном совпадении. Мои навыки генерации / моделирования данных отсутствуют, поэтому любые советы по созданию лучшего набора примеров также будут приветствоваться!