Модель обнаружения потери объекта с использованием ssd_mobilenet_v2_quantized_300x300_coco увеличивается после каждых 10–12 тыс. Шагов - PullRequest
0 голосов
/ 10 марта 2019

Я переобучаю ssd_mobilenet_v2_quantized_300x300_coco модель обнаружения объекта в пользовательском наборе данных. Набор данных состоит из примерно 2,6 тыс. Изображений и 19 классов. После того, как шаг тренировки достигает 10k-12k, график потерь начинает увеличиваться. Это происходит, даже если я меняю свою модель на ssd_mobilenet_v2_coco и с тем же шагом. Я не смог найти ничего, что связано с этим поведением в файле конфигурации. Также это разочаровывает при использовании faster_rcnn моделей. Когда возникает проблема, карта становится почти постоянной. Кроме того, точность не превышает 50%. Кто-нибудь может объяснить это поведение?

Пример набора данных:

enter image description here

График потерь

а) ssd_mobilenet_v2_quantized_300x300_coco ssd_mobilenet_v2_quantized_300x300_coco

б) ssd_mobilenet_v2_coco

enter image description here

Файл конфигурации: а) ssd_mobilenet_v2_quantized_300x300_coco

https://pastebin.com/BBwqEruK

б) ssd_mobilenet_v2_coco

https://pastebin.com/F8K0BhQV

1 Ответ

0 голосов
/ 18 марта 2019

А как насчет потери тренировок? Обратите внимание, что total_loss - это потеря проверки здесь.

Если ваша потеря на тренировке уменьшается, а потеря на валидацию увеличивается, это явно признак переобучения, вы можете использовать потерю регуляризации во время тренировки, добавив следующее в файл конфигурации, в части train_config

add_regularization_loss: true

так же, как batch_size: 24

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...