Это продолжение вопроса, на который здесь дан ответ , но я считаю, что оно заслуживает отдельной темы.
В предыдущем вопросе мы имели дело с «ансамблем классификаторов ансамбля»где каждый имеет свои параметры ». Давайте начнем с примера, представленного MaximeKan в его ответе:
my_est = BaggingClassifier(RandomForestClassifier(n_estimators = 100, bootstrap = True,
max_features = 0.5), n_estimators = 5, bootstrap_features = False, bootstrap = False,
max_features = 1.0, max_samples = 0.6 )
Теперь скажем, что я хочу подняться на один уровень выше: соображения как эффективность, вычислительные затраты и т. д., кроме как и в качестве общей концепции: как бы я запустил поиск по сетке с такой настройкой?
Я могу настроить две сетки параметров вдоль этих линий:
Один для BaggingClassifier
:
BC_param_grid = {
'bootstrap': [True, False],
'bootstrap_features': [True, False],
'n_estimators': [5, 10, 15],
'max_samples' : [0.6, 0.8, 1.0]
}
И один для RandomForestClassifier
:
RFC_param_grid = {
'bootstrap': [True, False],
'n_estimators': [100, 200, 300],
'max_features' : [0.6, 0.8, 1.0]
}
Теперь я могу вызвать поиск по сетке с помощью моей оценки:
grid_search = GridSearchCV(estimator = my_est, param_grid = ???)
Что мне делать с параметром param_grid
в этом случае?Или, более конкретно, как мне использовать обе сеточки параметров, которые я настроил?
Я должен сказать, что я играю с матрешками .