Я настроил модель обнаружения объекта на основе ssd_mobilenet_v2_quantized_coco из зоопарка модели тензорного потока: https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/detection_model_zoo.md
ssd_mobilenet_v2_quantized_coco
Моя точно настроенная модель всегда предсказывает 4 объекта, независимо от входного изображения.
Что может заставить модель учиться всегда предсказывать ровно 4 объекта?
Я проверил, что мои данные тренировок имеют широкий диапазон количества объектов на изображениях. Я попытался использовать файл конфигурации по умолчанию внутри zip базовой модели, а также файл, зарегистрированный в github: https://github.com/tensorflow/models/tree/master/research/object_detection/samples/configs. Оба дали одинаковый результат.
Мои файлы конфигурации конвейера основаны на значениях по умолчанию для модели ssd_mobilenet_v2_quantized_coco из https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/detection_model_zoo.md или https://github.com/tensorflow/models/tree/master/research/object_detection/samples/configs. Никаких изменений, кроме заполнения соответствующих локальных путей и использования моей пользовательской карты меток.
Я ожидаю, что моя модель сможет прогнозировать от 0 до 100 объектов. Вместо этого он всегда предсказывает 4.
Пример вывода: (этикетка): (доверие)
Изображение 1 (все неправильно):
STATIONARY_CAR: 0.0820312 PERSON: 0.0820312 PERSON: 0.0585938 STATIONARY_CAR: 0.0585938
Изображение 2 (машина правильная, отдых неправильный):
STATIONARY_CAR: 0.992188 PERSON: 0.0898438 PERSON: 0.0585938 PERSON: 0.0585938
Изображение 3 (все правильно):
STATIONARY_CAR: 0.910156 STATIONARY_CAR: 0.910156 STATIONARY_CAR: 0.867188 STATIONARY_CAR: 0.613281