sklearn случайный лес, чтобы найти количество выбранных функций - PullRequest
0 голосов
/ 04 мая 2020

Я пытаюсь понять, какой балл, полученный каждой выбранной функцией, является актуальным.

Я пробовал это до сих пор:

 classifier = 
 SelectFromModel(RandomForestClassifier(n_estimators = 100))
 m = classifier.fit(train.drop(columns='indicator'), train.rg_risk)
 X_train = train.drop(columns='indicator')
selected_feat=X_train.columns[(classifier.get_support())]
len(selected_feat)

1 Ответ

1 голос
/ 04 мая 2020

SelectFromModel - это встроенный метод: он использует алгоритмы со встроенными методами выбора функций.

В вашем случае вы используете RandomForest для выбора функций на основе важности функций. Он вычисляет важность функции, используя примеси узлов в каждом дереве решений.

При прохождении threshold=None окончательный порог важности функции вычисляется по умолчанию как среднее значение важности всех функций в дереве решений. Другие возможности - это медиана (работает так же, как среднее, но с медианой) или коэффициент масштабирования для настройки медианы / среднего ("1.25*mean", "1.25*median").

исходный sklearn

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...