Модель Over-Fit должна хорошо работать на входах из учебного набора. - PullRequest
0 голосов
/ 26 апреля 2020

В Keras с бэкэндом TF я обучаю регрессионную модель, которая предназначена для определения местоположения одной точки на изображении. Таким образом, это проблема регрессии с двумя выходами - местоположениями X и Y, указанными в виде долей ширины и высоты изображения, как в [0..1]. Хорошо, я тренируюсь, и ошибка поезда сводится к MSE, что соответствует примерно 2 пикселям на моем изображении 299x299. Для целей этого вопроса мне даже не нужно рассказывать, как прошел тест / валидация metri c. Так что теперь, если я использую свою недавно обученную модель для прогнозирования местоположения точки на изображениях из набора train , я должен видеть, что ответы в среднем составляют около 2 пикселей от точки правды земли. Но они не! Они в среднем около 30 пикселей! Я полагаю, что модель слишком подходит и, возможно, «запомнила» мой тренировочный набор, но на изображениях из тренировочного набора я должен увидеть хорошие результаты, верно? Я знаю, что не поделился с вами многими подробностями. Часть того, что я не знаю, как отлаживать, заключается в том, чтобы действительно увидеть, что происходит внутри функции «подгонки» Keras - как именно она формирует сигнал ошибки MSE. Я думаю, что мой генератор, который выдает как изображение, так и координаты точки земной истины, должен каким-то образом не понимать функцию «подгонки».

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...