Какая связь между cv и бустингом? - PullRequest
0 голосов
/ 03 ноября 2018

При перекрестной проверке результаты повышения наблюдаются по-разному в зависимости от значения num и repeat. Если [num = 5, repeat = 3], то нет ошибки для подбора модели. Однако, если [num = 2, repeat = 3], вы получите ошибку, что модель не подходит. Мне интересно, как cv влияет на подгонку модели, а не просто учится разделять данные поезда.

 crossval.ctrl1 <- trainControl(method = "repeatedcv", number = 5,  repeats = 3)

 crossval.ctrl2 <- trainControl(method = "repeatedcv", number = 2,  repeats = 3)

 stochastic.boosting <- train(Species ~ ., data = trainData, method = 'gbm', preProcess =c("center", "scale"), trControl = crossval.ctrl2, tuneLength = 5)

Ошибка:

1: ошибка подгонки модели для Fold1.Rep1: усадка = 0.1, Interaction.depth = 1, n.minobsinnode = 10, n.trees = 250 Ошибка в (функция (x, y, смещение = NULL, misc = NULL, распределение = "бернулли",:
Набор данных слишком мал или частота подвыборки слишком велика: nTrain * bag.fraction <= n.minobsinnode

2: ошибка подгонки модели для Fold1.Rep1: усадка = 0.1, Interaction.depth = 2, n.minobsinnode = 10, n.trees = 250 Ошибка в (функция (x, y, смещение = NULL, misc = NULL, распределение = "бернулли",:
Набор данных слишком мал или частота подвыборки слишком велика: nTrain * bag.fraction <= n.minobsinnode

3: подгонка модели не выполнена для Fold1.Rep1: усадка = 0.1, Interaction.depth = 3, n.minobsinnode = 10, n.trees = 250 Ошибка в (функция (x, y, смещение = NULL, misc = NULL, распределение = "бернулли",:
Набор данных слишком мал или частота подвыборки слишком велика: nTrain * bag.fraction <= n.minobsinnode

Я использовал данные ската в качестве данных анализа.

...