Я тренирую unet нейронную сеть. Во время обучения каждая итерация имеет «значение потерь». Это значение обычно сходится, но иногда перепрыгивает. Какие веса наконец сохраняются в файле .caffemodel
?
Что произойдет, если я сохраню его на итерации 20000, и именно в этот момент потери немного подскочили, и это не самая низкая потеря, которую он видел? Веса и уклоны сохраняются после последней итерации или что-то более умное, например, самая низкая из последних 5% итераций?
Спасибо