Я работаю со случайным лесом модели в R
, потому что я прочитал, что у него есть возможность показать важность функции.Я тестирую следующий код:
library(randomForest)
mod<-randomForest(PosDesertor ~ ., data=tabla_train, importance=TRUE,
localImp=TRUE, proximity=TRUE)
result<-predict(mod,tabla_test)
locImp = mod$localImportance
dim(locImp)
vars<-t(locImp)
head(vars,n=10)
, но он показывает важность функции модели с данными обучения, а не с данными теста.Это легко увидеть, если мы используем тестовый набор данных с меньшим количеством строк, чем обучающий набор.
Мой вопрос:
Как получить ту же матрицу важности функций, но с набором тестовых данных?
Или есть еще один способ добиться этого?