В качестве примера давайте воспользуемся набором данных радужной оболочки.
data(iris)
smp_size <- floor(0.75 * nrow(iris))
train_ind <- sample(seq_len(nrow(iris)), size = smp_size)
train <- iris[train_ind, ]
test <- iris[-train_ind, ]
Есть ли способ обучить (на наборе поездов) древовидный алгоритм повышения (например, GBM), затем извлечь деревья и использовать каждый из них для прогнозирования переменной ответа на тестовом наборе? В случае с упаковкой можно использовать значение $ индивидуальной функции predic (), вычисленное на случайном объекте леса.
model <- randomForest(Species~., data = train, proximity=TRUE, ntree=numTree)
trees <- predict(model, train, predict.all=TRUE)$individual
Спасибо!