Способы настройки Random Forrest в Python - PullRequest
0 голосов
/ 25 февраля 2019

В чем различия (преимущества, недостатки) между следующими 3 методами?В частности, что делает классификатор упаковки max_features = 1.?Поскольку установка значения с плавающей точкой ниже 1 приводит к ошибке, но она должна включать случайность в деревьях.Однако, может быть, это делается в параметре базовых оценок max_features?Так что же делает параметр max_features классификаторов пакетов?

# model 1
clf = DecisionTreeClassifier(criterion='entropy', max_features="auto",
                             class_weight='balanced', min_weight_fraction_leaf=minWLeaf)
clf = BaggingClassifier(base_estimator=clf, n_estimators=n_estimators,
                        max_features=1., max_samples=max_samples,
                        oob_score=True, n_jobs=n_jobs)
# model 2
clf = RandomForestClassifier(n_estimators=n_estimators, class_weight='balanced_subsample', criterion='entropy')
# model 3
clf = RandomForestClassifier(n_estimators=1, class_weight='balanced_subsample', 
                             criterion='entropy', bootstrap=False, oob_score=True)
clf = BaggingClassifier(base_estimator=clf, n_estimators=n_estimators,
                        max_features=1., max_samples=max_samples,
                        oob_score=True, n_jobs=n_jobs)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...