Я использую пакет olsrr
с функцией ols_step_all_possible
. В моей модели 4 предикторных переменной: Year
, Lay_date
, Clutch_size
и Yolk_mass
.
Моя первая модель, которую я определяю так:
m1 <- lm(T4 ~ Year + Jul_date + Clutch_size + Yolk_mass, data=data)
k1 <- ols_step_all_possible(m1)
Выход (k1
) затем дает мне 15 возможных моделей с различными комбинациями предикторов. Хорошо. Теперь я хочу включить двустороннее взаимодействие.
m2 <- lm(T4 ~ Year*Jul_date + Year*Clutch_size + Year*Yolk_mass, data=data)
k2 <- ols_step_all_possible(m2, iterm = TRUE)
Вот где я застрял: вывод k2
генерирует 127 возможных моделей (все возможные). Некоторые из них включают взаимодействия без включения основного эффекта. Например, модель с наибольшим скорректированным R-квадратом включает в себя следующие предикторы:
Jul_date
, Clutch_size
, Yolk_mass
, Year:Yolk_mass
Переменная Year
равна тот, который меня в основном интересует. Однако, здесь он включен только как взаимодействие с массой желтка, а не как основной эффект (обозначенный «:» вместо «*»).
Как выбрать интересующую модель с наибольшим R-квадратом? Могу ли я добавить команду, которая заставляет R всегда игнорировать модели, которые не включают Year
в качестве основного фактора? Или я должен просто поискать в выводе k2
и найти модель, которая 1) включает в себя Year
и 2) из тех, которые имеют самый высокий R-квадрат?
Спасибо за вашу помощь заранее!
Приветствия, Maggi