Создание фиктивных переменных в множественной регрессии в случае, когда 1 уровень предиктора является подгруппой другого уровня? - PullRequest
0 голосов
/ 29 ноября 2018

Я выполняю линейную регрессию со смешанными эффектами в R, используя lme4 :: lmer.

Я хочу проверить, влияет ли тяжесть заболевания родителей на баллы потомства по показателю.У меня есть выборка связанных лиц, и я использую повторные измерения, поэтому я включил семейные и индивидуальные идентификаторы как случайные эффекты в модель.Формула регрессии:

lme4::lmer(score ~ parsev + time + age + sex + (1|fid) + (1|iid), data = df, REML = FALSE)

Предиктор parsev представляет серьезность болезни родителя, где:

0 = control;
1 = illness;
2 = severe illness

Я хотел бы повторно запустить регрессию с фиктивными переменными, чтобы я мог получитьотдельные коэффициенты регрессии, отражающие влияние родительских и тяжелых заболеваний на баллы потомства.

Однако «тяжелая болезнь» является подмножеством «болезни», поэтому я не уверен, как создать фиктивные переменные из парсева, которые ответили бы на мой вопрос.

Моим лучшим предположением было бы:

df %>% 
mutate(parenti = case_when(parentmismi == 1 | parentmismi == 2 ~ 1,
TRUE ~ 0), 
parentsi = case_when(parentmismi == 2 ~ 1,
TRUE ~ 0))

Любой вклад приветствуется.

...