Какая модель: лучшая оценка из gridsearchCV или все данные обучения? - PullRequest
0 голосов
/ 28 октября 2018

Я немного растерялся, когда речь заходит о gridsearch и подходящей финальной модели.Я разделил на 2: обучение и тестирование.Набор для тестирования используется только для окончательной оценки.Я выполняю поиск по сетке, используя только данные обучения.

Скажем, кто-то выполнил поиск по сетке по нескольким гиперпараметрам, используя перекрестную проверку.Поиск по сетке дает наилучшую комбинацию гиперпараметров.Следующий шаг - тренировка модели, и вот тут я запутался.Я вижу 2 варианта:

1) Не тренируйте модель.Используйте параметры из лучшей модели из сетки поиска.

или

2) Не используйте параметры из лучшей модели из сетки поиска.Тренируйте модель на полном тренировочном наборе с лучшей комбинацией гиперпараметров из таблицы поиска.

Какой правильный подход, 1 или 2?

1 Ответ

0 голосов
/ 28 октября 2018

Вы тренируете модель, используя обучающий набор и параметры, полученные GridSearch.

И тогда вы можете протестировать модель с помощью тестового набора.

...