Я новичок в изучении scikit, поэтому прошу прощения за мое невежество.Используя GridsearchCV, я пытаюсь оптимизировать DecisionTreeRegressor.Чем шире пространство параметров, тем хуже становится оценка.
Установка min_samples_split в диапазон (2,10) дает мне neg_mean_squared_error, равный -0,04.При установке его в диапазоне (2,5) Оценка составляет -0,004.
simple_tree =GridSearchCV(tree.DecisionTreeRegressor(random_state=42), n_jobs=4, param_grid={'min_samples_split': range(2, 10)}, scoring='neg_mean_squared_error', cv=10, refit='neg_mean_squared_error')
simple_tree.fit(x_tr,y_tr).score(x_tr,y_tr)
Я ожидаю, что при более широком поиске в сетке будет достигнут такой же или более положительный результат по сравнению с менее расширенным.