В чем различия (преимущества, недостатки) между следующими 3 методами?В частности, что делает классификатор упаковки max_features = 1.?Поскольку установка значения с плавающей точкой ниже 1 приводит к ошибке, но она должна включать случайность в деревьях.Однако, может быть, это делается в параметре базовых оценок max_features?Так что же делает параметр max_features классификаторов пакетов?
# model 1
clf = DecisionTreeClassifier(criterion='entropy', max_features="auto",
class_weight='balanced', min_weight_fraction_leaf=minWLeaf)
clf = BaggingClassifier(base_estimator=clf, n_estimators=n_estimators,
max_features=1., max_samples=max_samples,
oob_score=True, n_jobs=n_jobs)
# model 2
clf = RandomForestClassifier(n_estimators=n_estimators, class_weight='balanced_subsample', criterion='entropy')
# model 3
clf = RandomForestClassifier(n_estimators=1, class_weight='balanced_subsample',
criterion='entropy', bootstrap=False, oob_score=True)
clf = BaggingClassifier(base_estimator=clf, n_estimators=n_estimators,
max_features=1., max_samples=max_samples,
oob_score=True, n_jobs=n_jobs)