Я только что заметил, что существует значительное расхождение в производительности модели между этапом обучения и вывода в Керасе.
Я обучил модель сегментации U-Net со слоями нормализации партии. Точность сегментации, основанная на метриках Dice, достигает примерно 0,92. Однако, когда я применяю один и тот же набор данных к одной и той же модели с точно такими же весами на этапе вывода (model.predict), точность сегментации упала даже на 5–6 процентов.
Я много гуглил и обнаружил, что это будет связано с тем, как слой нормализации партий работает на этапе обучения и вывода для обновления скользящей средней и дисперсии в мини-партиях.
Однако до сих пор я не нашел решения для решения этой проблемы. Я пытался даже с бинарной функцией потери энтропии, но это не помогло. Также понижено значение импульса в партии нормы. слой, и это не было эффективным.
Кто-нибудь знает, как мы можем получить те же результаты в фазе прогнозирования (вывода)?