Question

Я переобучаю ssd_mobilenet_v2_quantized_300x300_coco модель обнаружения объекта в пользовательском наборе данных. Набор данных состоит из примерно 2,6 тыс. Изображений и 19 классов. После того, как шаг тренировки достигает 10k-12k, график потерь начинает увеличиваться. Это происходит, даже если я меняю свою модель на ssd_mobilenet_v2_coco и с тем же шагом. Я не смог найти ничего, что связано с этим поведением в файле конфигурации. Также это разочаровывает при использовании faster_rcnn моделей. Когда возникает проблема, карта становится почти постоянной. Кроме того, точность не превышает 50%. Кто-нибудь может объяснить это поведение?

Пример набора данных:

График потерь

а) ssd_mobilenet_v2_quantized_300x300_coco

б) ssd_mobilenet_v2_coco

Файл конфигурации: а) ssd_mobilenet_v2_quantized_300x300_coco

https://pastebin.com/BBwqEruK

б) ssd_mobilenet_v2_coco

https://pastebin.com/F8K0BhQV

danyfang · Answer 1 · 18 марта 2019

А как насчет потери тренировок? Обратите внимание, что total_loss - это потеря проверки здесь.

Если ваша потеря на тренировке уменьшается, а потеря на валидацию увеличивается, это явно признак переобучения, вы можете использовать потерю регуляризации во время тренировки, добавив следующее в файл конфигурации, в части train_config

add_regularization_loss: true

так же, как batch_size: 24

Модель обнаружения потери объекта с использованием ssd_mobilenet_v2_quantized_300x300_coco увеличивается после каждых 10–12 тыс. Шагов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Модель обнаружения потери объекта с использованием ssd_mobilenet_v2_quantized_300x300_coco увеличивается после каждых 10–12 тыс. Шагов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы