Как интерпретировать раннее внезапное увеличение функции потери, а затем нормальное снижение? - PullRequest
0 голосов
/ 09 июля 2019

Как интерпретировать раннее внезапное увеличение функции потери, затем нормальное снижение?

Данные: 128x128x4 изображения (случайным образом разделенные: 60% поезд, 20% val, 20% тест) GT: один горячий код 128x128x3 (потому что 3 разных класса)

модель: unet (сегментация изображения) lr: от 0,01 до 0,0001 (снижение на плато) Размер партии: 16

Вот графики моего обучения: потери при проверке набора (логический вывод) и потеря тренировки

Почему в течение первых 3 выводов потери уменьшаются, а затем внезапно увеличиваются в течение одной эпохи?

1 Ответ

0 голосов
/ 10 июля 2019

Помните, что функция «потери» - это просто показатель ошибки для этой итерации. Для большинства моделей это повышается и падает в процессе обучения с общей тенденцией к снижению.

То, что вы видите, просто говорит о том, что раннее предположение было довольно хорошим для всего профиля весов моделей. Однако это предположение было «правильным по неправильным причинам». Есть много способов, которыми это может произойти. Один из них я видел несколько раз в модели изображения "собака против кошки". Перестановка данных иногда вызывает несколько ранних партий, в которых фотографии кошек обычно находятся в помещении, а фотографии собак - снаружи. Раннее обучение затем учится ассоциировать «кошку» с мебелью, а «собаку» с газоном / деревьями / цветами. Когда остальная часть набора данных обнаруживается, все эти обучающие узлы должны быть выброшены и переобучены, что вызывает большой всплеск функции потерь.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...