Я хочу создать фрейм данных в R, который бы отображал выходные данные randomForest (ошибка выборки и ошибка выборки) вместе с числом переменных и деревьев.
tmp = train[sample(nrow(train), 500),]
num_trees <- c(100,200,300,400,500,600,700,800,900,1000)
for (n in num_trees){
for (i in 1:8){
forest <- randomForest(UNITS ~ FEATURE + DISPLAY + PRICE + SUB_CATEGORY + TPR_ONLY + MANUFACTURER + BASE_PRICE + STORE_NUM, data = tmp,ntree = n, mtry = i,importance = TRUE)
predict_forest <- predict (forest, train, type = "class") #predicting insample
print(paste0("In-sample error, node ", i,", no.trees: ", n, ": ", sqrt(mean((predict_forest - train$UNITS)^2)))) #in-sample error
predict_forest_test<- predict(forest, test, type = "class") #predicting out-of-sample
print(paste0("Out-of-sample error, node ", i,", no.trees: ", n, ": ", sqrt(mean((predict_forest_test - test$UNITS)^2))))#out-of-sample error
}
}
Итак, вместо того, чтобы печатать результаты, я хотел бы сформировать набор данных. 1-й столбец будет нет. деревьев, 2-й столбец будет нет. переменных, 3-й и 4-й столбцы будут иметь значения ошибок для всех комбинаций деревьев и переменных соответственно.
Cheers, Ax