Я - новая статистика, и я пытаюсь сделать пошаговую множественную регрессию с категориальным предиктором, используя train () в пакете каретки. Но я не думаю, что я делаю это правильно. Вот мой код:
#Stepwise multiple regression
set.seed(123)
# Set up repeated k-fold cross-validation
train.control <- trainControl(method = "cv", number = 10)
# Train the model
step.model <- train(Rebreeding_Score ~., data = dfp1,
method = "leapBackward",
tuneGrid = data.frame(nvmax = 1:5),
trControl = train.control
)
step.model$results
step.model$bestTune
summary(step.model$finalModel)
coef(step.model$finalModel, 5)
Кажется, что функция выбирает определенные c категории внутри предиктора, а не предиктора в целом. Я надеюсь, что я объясняю это правильно ...
Вывод: Результат 1 Результат 2
В идеале модель множественной регрессии должна выглядеть следующим образом .
Rfinal <- lm(Rebreeding_Score ~ Cohort + mating_group, data = dfp1, na.action = na.omit)
summary(Rfinal)
Любая помощь будет принята с благодарностью. Спасибо.