измерение производительности gridSearchCV - PullRequest
0 голосов
/ 15 марта 2019

У меня есть назначение, и он просит меня:

Улучшить производительность моделей из предыдущего шага с настройкой гиперпараметра и выбрать окончательную оптимальную модель, используя поиск в сетке на основе метрики (или метрик), что вы выбираете.Выбор оптимальной модели для данной задачи (сравнение нескольких регрессоров в конкретной области) требует выбора показателей производительности, например, R2 (коэффициент детерминации) и / или RMSE (среднеквадратическая ошибка) для сравнения производительности модели.

Я использовал этот код для настройки гиперпараметра:

model_example = GradientBoostingRegressor()
parameters = {'learning_rate': [0.1, 1], 
              'max_depth': [5,10]}

model_best = GridSearchCV(model_example,
                          param_grid=parameters,
                          cv=2,scoring='r2').fit(X_train_new,y_train_new)
model_best.best_estimator_

Я нашел скорость обучения = 0,1 и max_dept = 5 Я выбрал скоринг = 'r3' в качестве показателя производительности, но он не 'Это никак не повлияло на точность моей модели, когда я использовал этот код для предоставления своей лучшей модели:

my_best_model = GradientBoostingRegressor(learning_rate=0.1,
                                          max_depth=5).fit(X_train_new,y_train_new)
my_best_model.score(X_train_new,y_train_new)

Знаете ли вы, что не так с моей работой?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...