Что означает, что потери в Керасе различаются на несколько порядков между моделями? - PullRequest
0 голосов
/ 24 апреля 2020

Для контекста, я обучил два отдельных автоэнкодера в Keras: один со стандартной функцией потери MSE и один с настроенной функцией потери MSE. При оценке обеих моделей в определенный момент обучения они имеют очень похожие характеристики, но потери очень разные.

Мой показатель c для производительности - это средняя процентная ошибка. Обе модели воссоздают исходное изображение со средней ошибкой порядка 3%. Однако, когда эти модели были сохранены, стандартная модель Keras MSE имела потери менее 1,0, в то время как модель с настраиваемой функцией стоимости MSE имела потери порядка 30 *. 1003 *

Если они работают с таким непротиворечивым уровень, почему потери так резко отличаются?

1 Ответ

1 голос
/ 24 апреля 2020

Потеря - это просто скаляр, который указывает моделирующему поезду, в каком направлении двигаться, чтобы отрегулировать вес. Если вы умножите убыток на скаляр, результат будет почти таким же. Я не говорю, что абсолютное значение не имеет значения, оно имеет значение. Но это не центральная точка. Вероятно, разница в вашем случае происходит из-за того, что Keras MSE выполняет некоторые нормализации, которые вы не делаете.

...