Я пытаюсь воспроизвести результаты модели SSDLite, описанной в статье MobileNetV2 (arXiv: 1801.04381), которая должна достичь около 22,1% мАП при вызове обнаружения COCO. Тем не менее, я застрял на 9% MAP. Это странное поведение, потому что модель работает несколько, но все еще далека от сообщенного результата. Может ли этот большой разрыв быть вызван выбором гиперпараметров / оптимизатора (я использую adam вместо sgd), или почти наверняка есть ошибка в моей реализации?
Стоит также упомянуть, что модель успешно подходит для небольшого подмножества тренировочного набора, но в целом тренировочный набор кажется, что потери достигают плато довольно быстро.
Кто-нибудь сталкивался с подобной проблемой?