У нас обычно есть 3 типа наборов данных для обучения модели,
- Набор обучающих данных
- Набор проверочных данных
- Набор тестовых данных
Набор обучающих данных
Это должен быть равномерно распределенный набор данных, который охватывает все виды данных.Если ваш поезд имеет больше эпох , модель привыкнет к набору обучающих данных и даст только надлежащий правильный прогноз на наборе обучающих данных, и это называется Overfitting .Единственный способ сохранить проверку на переоснащение состоит в том, чтобы иметь другие наборы данных, на которых модель никогда не обучалась.
Валидационный набор данных
Для этого можно использовать гиперпараметры модели точной настройки.
Набор тестовых данных
Этот набор данных, на котором модель не была обучена, никогда не принимал участие в определении гиперпараметров и даст представление о том, как модельвыполняет.