Различные результаты важности функций с использованием пакетов mlr и randomForest - PullRequest
0 голосов
/ 08 июля 2019

Итак, я хочу выполнить выбор функции для моей модели случайного леса.Сначала я использовал пакет mlr, затем пакет randomForest, чтобы все проверить, и результаты важности функций отличаются.

#MLR
#DEFINE A TASK
HP48_task <- makeClassifTask(data=df_24cech_zap_omit, target='HP48')

#Feature filtering
fv = generateFilterValuesData(HP48_task, method=c('randomForest_importance'))
fv$data

#randomForest
model_first <- randomForest(HP48~., data=df_24cech_zap_omit ,importance = T)
importance(model_first, class='HP48')
> head(fv$data)
                name    type randomForest_importance 
1           PLEC_ALL  factor                6.284084
2           wiek2015 numeric                6.779634
3         wiek6_2015  factor                5.042052
4        L_OSOB_2015 numeric                3.113163 
5 KLASA_MIEJSCOWOSCI  factor                6.987793
6               HC11  factor                5.506360

> head(importance(model_first, class='HP48'))
                         NIE        TAK MeanDecreaseAccuracy MeanDecreaseGini
PLEC_ALL            6.118796 -0.6763398             5.403122         14.81937
wiek2015           10.191208  0.4670294             9.553786         80.99328
wiek6_2015          5.367055  0.1594754             5.090515         37.88534
L_OSOB_2015         4.916890 -1.1206233             3.913224         51.55660
KLASA_MIEJSCOWOSCI 10.066962 -1.4121966             9.147862         59.66335
HC11                5.929320  1.5730634             6.191208         24.77438

Это нормально или я допускаю некоторые ошибки в коде?Какой степени важности я должен доверять?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...