В R у меня есть модель логистической регрессии следующим образом
train_control <- trainControl(method = "cv", number = 3)
logit_Model <- train(result~., data=df,
trControl = train_control,
method = "glm",
family=binomial(link="logit"))
calculatedVarImp <- varImp(logit_Model, scale = FALSE)
Я использую несколько наборов данных, проходящих через один и тот же код, поэтому значение переменной для каждого набора данных изменяется. Есть ли способ получить имена переменных, которые меньше n (например, 1) по общей важности, чтобы я мог автоматизировать удаление этих переменных и повторно запустить модель.
Мне не удалось получить информацию из переменной 'selectedVarImp', указав значение 'total' * в подмножестве
lowVarImp <- subset(calculatedVarImp , importance$Overall <1)
Кроме того, есть ли лучший способ выбора переменных?
Заранее спасибо