Получение списка функций, используемых во время обучения Random Forest Regressor - PullRequest
0 голосов
/ 17 октября 2018

Я использовал один набор данных для изучения регрессора случайных лесов, и сейчас у меня есть другой набор данных с меньшим количеством функций (подмножество предыдущего набора).

Есть ли функция, которая позволяет получитьсписок имен столбцов, использованных при обучении модели Random Forest Regressor?Если нет, то существует ли функция, которая для отсутствующих столбцов присваивает значения Null?

1 Ответ

0 голосов
/ 18 октября 2018

Существует ли функция, позволяющая получить список имен столбцов, используемых при обучении модели Random Forest Regressor?

RF использует все функции из вашего набора данных.Каждое дерево может содержать sqrt (num_of_features) или log2 (num_of_features) или что угодно, но эти столбцы выбираются случайным образом.Поэтому обычно RF покрывает все столбцы из вашего набора данных.

Может быть крайний случай, когда вы используете небольшое количество оценок в RF, и некоторые функции могут не учитываться.Я полагаю, что может помочь RandomForestRegressor.feature_importances_ (здесь могут быть индикаторы с нулевым или наноразмерным значением) или погрузиться в каждое дерево в RandomForestRegressor.estimators_.

Если нет, то есть функция, которая для отсутствующих столбцовприсвоит Nulls?

RF не принимает пропущенные значения.Либо вам нужно кодировать пропущенное значение как отдельный класс (и использовать его для обучения), либо XGBoost (например) - ваш выбор.

...