Я сравниваю две модели и хочу уточнить странные результаты.
Модель 1 достигает меньших потерь при обучении, чем модель 2, но получает более высокие потери при проверке.
Из-за чрезмерного соответствия и недостаточная подгонка определяются путем сравнения потери обучения / проверки их правильности, поэтому, я думаю, что это не проблема переборки.
Точно, я сейчас тренируюсь с классификационными задачами облака точек,
получил тренировочную потерю модели 1: 1,51, тестовую потерю: 1,56 / тренировочную потерю модели 2: 1,37, тренировочную потерю: 1,58.
Все остальные условия такие же.
Итак, вопрос есть, как это может случиться, потеря теста меньше потери обучения?