Создание кадра данных в R в двойном цикле - PullRequest
0 голосов
/ 18 февраля 2020

Я хочу создать фрейм данных в R, который бы отображал выходные данные randomForest (ошибка выборки и ошибка выборки) вместе с числом переменных и деревьев.

tmp = train[sample(nrow(train), 500),]
num_trees <- c(100,200,300,400,500,600,700,800,900,1000)
for (n in num_trees){
  for (i in 1:8){
    forest <- randomForest(UNITS ~ FEATURE + DISPLAY + PRICE + SUB_CATEGORY + TPR_ONLY + MANUFACTURER + BASE_PRICE + STORE_NUM, data = tmp,ntree = n, mtry = i,importance = TRUE)
    predict_forest <- predict (forest, train, type = "class") #predicting insample
    print(paste0("In-sample error, node ", i,", no.trees: ", n, ": ", sqrt(mean((predict_forest - train$UNITS)^2)))) #in-sample error
    predict_forest_test<- predict(forest, test, type = "class") #predicting out-of-sample
    print(paste0("Out-of-sample error, node ", i,", no.trees: ", n, ": ", sqrt(mean((predict_forest_test - test$UNITS)^2))))#out-of-sample error
  }
}

Итак, вместо того, чтобы печатать результаты, я хотел бы сформировать набор данных. 1-й столбец будет нет. деревьев, 2-й столбец будет нет. переменных, 3-й и 4-й столбцы будут иметь значения ошибок для всех комбинаций деревьев и переменных соответственно.

Cheers, Ax

...