Я хотел бы использовать перекрестную проверку, чтобы определить количество переменных, которые нужно попробовать в методе случайного леса. Я не понимаю, как использовать аргумент mtry
в функции rfcv()
.
В моем наборе данных 6 предикторов. Я хочу использовать mtry = 6,5,4,3,2,1
, например, любое возможное значение m, и перекрестную проверку с 5-кратным CV.
Я считаю, что это можно сделать с помощью функции rfcv()
пакета randomForest
. Я запускаю код:
rf_cv<- rfcv(training_x,training_y,cv.fold=5, mtry=function(p) max(1, p-1))
Однако вызов rf_cv$n.var
дает мне: [1] 6 3 1
Таким образом, этот метод не применяется mtry
как Я надеялся, так как сказал, что каждый раз вычитайте количество переменных, используемых 1.
Как я могу попробовать каждое количество переменных, применяя 5-кратную перекрестную проверку для каждого количества переменных?
Я проверил этот пост, но он не полностью связан, так как они обсуждают значение mtry
по умолчанию.