Нужно ли выполнять как gridsearch (с перекрестной проверкой), так и затем метод перекрестной проверки? - PullRequest
0 голосов
/ 11 мая 2019

Я делю свой набор данных на данные обучения, проверки и тестирования, а затем выполняю перекрестную проверку gridsearch на данных обучения.Достаточно ли этого в качестве метода перекрестной проверки или мне нужно реализовать перекрестную проверку в k-кратном порядке после моего GridSearchCV?Я немного сбит с толку, так как думаю, что gridsearch только помогает мне найти оптимальные гиперпараметры.

1 Ответ

0 голосов
/ 11 мая 2019

Поиск по сетке - это исчерпывающий поиск гиперпараметров модели, но он также включает перекрестную проверку, если вы хотите его использовать.Требуется больше времени для запуска поиска по сетке с CV, поскольку это исчерпывающий метод.Поиск по сетке в sklearn имеет возможность перекрестной проверки cv.Пожалуйста, обратитесь к официальному документу для получения дополнительной информации об этом https://scikit -learn.org / stable / modules / generate / sklearn.model_selection.GridSearchCV.html

Вы также можете предоставить KFoldКласс для вашего gridsearch, подобный этому

validation = KFold(n_splits=10, shuffle=True)
clf = GridSearchCV(..., cv=validation)
clf.fit(X,y)

Вы также можете запускать комбинацию CV и gridsearch, то есть gridsearch на каждой итерации перекрестной проверки, хотя это будет очень требовательным к вычислениям.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...