Я немного растерялся, когда речь заходит о gridsearch и подходящей финальной модели.Я разделил на 2: обучение и тестирование.Набор для тестирования используется только для окончательной оценки.Я выполняю поиск по сетке, используя только данные обучения.
Скажем, кто-то выполнил поиск по сетке по нескольким гиперпараметрам, используя перекрестную проверку.Поиск по сетке дает наилучшую комбинацию гиперпараметров.Следующий шаг - тренировка модели, и вот тут я запутался.Я вижу 2 варианта:
1) Не тренируйте модель.Используйте параметры из лучшей модели из сетки поиска.
или
2) Не используйте параметры из лучшей модели из сетки поиска.Тренируйте модель на полном тренировочном наборе с лучшей комбинацией гиперпараметров из таблицы поиска.
Какой правильный подход, 1 или 2?