Это могут быть ваши данные, и я думаю, что вы делаете разумный шаг, улучшая неоднородность набора данных, НО это также может быть вашим выбором модели.
Стоит отметить, что ssd_mobilenet_v1_coco имеет наименьшую карту COCO по сравнению с другими моделями в TensorFlow Object Detection API модель zoo . Вы не пытаетесь обнаружить объект COCO, но числа mAP - разумное приближение для общей точности модели.
На самом высоком уровне выбор модели в значительной степени является компромиссом между скоростью и точностью. Выбранная вами модель ssd_mobilenet_v1_coco предпочитает скорость, а не точность. Следовательно, я рекомендую вам попробовать одну из моделей Faster RCNN (например, fast_rcnn_inception_v2_coco), прежде чем тратить значительное количество времени на предварительную обработку изображений.