Пошаговая логистическая регрессия, остановка в лучшем случае N функций - PullRequest
0 голосов
/ 20 сентября 2018

Я заинтересован в изучении того, что выталкивает из ступенчатой ​​логистической регрессии из верхних N переменных ... будь то 5 или 15 в зависимости от моих предпочтений.

Я пытался поиграть с пакетом Caret:

set.seed(23)
library(caret)
library(mlbench)
data(Sonar)
traincontrol <- trainControl(method = "cv", number = 5, returnResamp = "all", savePredictions='all', classProbs = TRUE, summaryFunction = twoClassSummary)

glmstep_mod <- train(Class ~.,
                     data = Sonar,
                     method = "glmStepAIC", 
                     trControl = traincontrol,
                     metric = "ROC", 
                     trace = FALSE)

Но это приводит к множеству различных переменных для окончательной модели.

Какие-нибудь пакеты, которые позволяют мне это делать, код, который я могу сгенерировать самостоятельно, или пропущенные параметры этих функций для этого?Чтобы я мог сказать max_variables = N?И дать ему несколько попыток увидеть компромисс?

Обычно я экспериментирую с лассо или некоторыми другими типами моделей, и я знаю о преимуществах / недостатках, которые дает поэтапный шаг.

...