Как убедиться, что одна функция включена во все деревья в случайном лесу - PullRequest
0 голосов
/ 28 мая 2018

В настоящее время я использую sklearn для создания классификатора случайных лесов, но я хочу убедиться, что одна конкретная функция, которая, на мой взгляд, является наиболее важной, будет включена во все сгенерированные деревья решений.

Какой самый простой способ сделать это?Должен ли я реализовать собственный алгоритм произвольного леса самостоятельно или просто изменить исходный код пакета sklearn?Если так, как я могу изменить это?Спасибо!

1 Ответ

0 голосов
/ 28 мая 2018

Инициализируйте объект RandomForestClassifier с атрибутом warm_start, установленным в значение true.Установите RF, итерируйте его деревья членов (как указано в атрибуте estimators_) и удалите все, что не содержит эту, предположительно, очень важную функцию.Повторяйте процесс до тех пор, пока не будет готова модель RF с необходимым количеством деревьев элементов-элементов.

...