Я пытаюсь построить модель множественной линейной регрессии:
lm1 <- lm(outcome ~ sex + age + education + cohort, data=data.in)
Среди независимых переменных пол, образование и когорта являются категориальными переменными, поэтому я должен добавить factor () для этих переменных в модель? Мне также нужно получить скорректированное (оценочное) среднее значение для результата для мужчин и женщин отдельно, поэтому я создал два набора данных, разделенных по полу:
data.in.m <- data.in %>% fitler(sex==1)
data.in.f <- data.in %>% fitler(sex==2)
Затем я попытался использовать
mean(fitted(lm1,data.in.m))
или
mean(predict(lm1,data.in.m))
, чтобы получить скорректированные средние результаты у мужчин (из исходного набора данных).
Я не уверен, стоит ли мне использовать fit () или pregnet (), поскольку две функции здесь дают два разных значения.