Я заинтересован в изучении того, что выталкивает из ступенчатой логистической регрессии из верхних N переменных ... будь то 5 или 15 в зависимости от моих предпочтений.
Я пытался поиграть с пакетом Caret:
set.seed(23)
library(caret)
library(mlbench)
data(Sonar)
traincontrol <- trainControl(method = "cv", number = 5, returnResamp = "all", savePredictions='all', classProbs = TRUE, summaryFunction = twoClassSummary)
glmstep_mod <- train(Class ~.,
data = Sonar,
method = "glmStepAIC",
trControl = traincontrol,
metric = "ROC",
trace = FALSE)
Но это приводит к множеству различных переменных для окончательной модели.
Какие-нибудь пакеты, которые позволяют мне это делать, код, который я могу сгенерировать самостоятельно, или пропущенные параметры этих функций для этого?Чтобы я мог сказать max_variables = N?И дать ему несколько попыток увидеть компромисс?
Обычно я экспериментирую с лассо или некоторыми другими типами моделей, и я знаю о преимуществах / недостатках, которые дает поэтапный шаг.