Tensorflow: проблемы с обучением SSD Mobilenet на пользовательском наборе данных - PullRequest
0 голосов
/ 29 апреля 2018

Я пытаюсь обучить сеть SSD Mobilenet в пользовательском наборе данных, используя API обнаружения объектов Tensorflow. Мой набор данных содержит около 90000 изображений, из которых 80 процентов являются тренировочными (около 75 тыс.), А остальные проверяются (eval).

В моем наборе данных 12 классов, и он изначально использовался с YOLO, поэтому я использовал этот конвертер для создания обучающих и проверочных файлов TFRecord. Я удостоверился, что мой текст метки был правильным, начиная с ID класса 1 и т. Д. Я использую контрольные точки ssd-mobilenet-v1, прошедшие предварительную подготовку, из модельного зоопарка, и изменил файл конфигурации, чтобы указать мои файлы записей, и установил num_examples для Eval к ​​количеству проверочных изображений, которые я имею. Я работал с Tensorflow 1.4.1 и v1.5 API обнаружения объектов.

Ничто не кажется явно неправильным в окне обучения, но сеть не совсем правильно изучает объекты. Это видно из этих снимков с Tensorboard.

screenshot from 2018-04-28 08-57-20

screenshot from 2018-04-28 08-58-05

Кажется, что он обнаруживает только 2/12 классов довольно прилично, и даже после этого сильно путается с классификацией, даже после ~ 50 тыс. Шагов. Потеря также, кажется, колеблется и фактически не уменьшается. Я надеялся получить несколько советов о том, как расследовать, что может быть не так в моем обучении.

...