У меня есть эта модель:
enet2_model <- train(
x = train_glm[-1],
y = train_glm[[1]],
method = "enet",
preProcess = c("center", "scale"),
metric = "RMSE",
maximize = FALSE,
trControl = trainControl(
method = 'repeatedcv',
number = n_folds,
repeats = n_reps,
search = "grid",
selectionFunction = "oneSE",
savePredictions = "final",
seeds = caret_seeds # note: use the same seed!!
),
tuneGrid = expand.grid(
fraction = seq(
from = 9e-2,
to = 5e-1,
length.out = tune_length/2
),
lambda = c(0, seq(
from = 9e-3,
to = 1e-1,
length.out = tune_length/2 - 1
))
)
)
Я пытаюсь понять, по какому критерию я должен правильно выбрать диапазон лямбды и дроби, глядя на этот вид графика
, полученное с помощью этой функции
ggplot(enet2_model, highlight = TRUE)
Если вы посмотрите на график, вы увидите квадрат в левом верхнем углу. Я хочу выбрать более простую модель с одним стандартным отклонением от лучшей модели, которая явно соответствует минимальной точке. Вопрос: как выбрать дробь и лямбду? Какой критерий вы бы использовали?
РЕДАКТИРОВАТЬ: Этот график соответствует предыдущей реализации с другими параметрами:
В этом графике I см. (назовем это 1st-моделью) 1std-модель, попадающую на кривую, соответствующую лямбде с не самым глубоким минимумом. Поэтому я решил сделать первое изображение, которое вы можете увидеть в этом топи c. Мой новый вопрос: видение, что 1-я модель падает на кривую, которая не соответствует кривой с самым глубоким минимумом, может быть критерием для поиска другого набора параметров, чтобы выбрать вашу модель Лассо?