При перекрестной проверке результаты повышения наблюдаются по-разному в зависимости от значения num и repeat.
Если [num = 5, repeat = 3], то нет ошибки для подбора модели.
Однако, если [num = 2, repeat = 3], вы получите ошибку, что модель не подходит. Мне интересно, как cv влияет на подгонку модели, а не просто учится разделять данные поезда.
crossval.ctrl1 <- trainControl(method = "repeatedcv", number = 5, repeats = 3)
crossval.ctrl2 <- trainControl(method = "repeatedcv", number = 2, repeats = 3)
stochastic.boosting <- train(Species ~ ., data = trainData, method = 'gbm', preProcess =c("center", "scale"), trControl = crossval.ctrl2, tuneLength = 5)
Ошибка:
1: ошибка подгонки модели для Fold1.Rep1: усадка = 0.1,
Interaction.depth = 1, n.minobsinnode = 10, n.trees = 250 Ошибка в (функция
(x, y, смещение = NULL, misc = NULL, распределение = "бернулли",:
Набор данных слишком мал или частота подвыборки слишком велика:
nTrain * bag.fraction <= n.minobsinnode
2: ошибка подгонки модели для Fold1.Rep1: усадка = 0.1,
Interaction.depth = 2, n.minobsinnode = 10, n.trees = 250 Ошибка в (функция
(x, y, смещение = NULL, misc = NULL, распределение = "бернулли",:
Набор данных слишком мал или частота подвыборки слишком велика:
nTrain * bag.fraction <= n.minobsinnode
3: подгонка модели не выполнена для Fold1.Rep1: усадка = 0.1,
Interaction.depth = 3, n.minobsinnode = 10, n.trees = 250 Ошибка в (функция
(x, y, смещение = NULL, misc = NULL, распределение = "бернулли",:
Набор данных слишком мал или частота подвыборки слишком велика:
nTrain * bag.fraction <= n.minobsinnode
Я использовал данные ската в качестве данных анализа.