Модель обнаружения объектов застряла на низкой карте - PullRequest
2 голосов
/ 11 января 2020

Я пытаюсь воспроизвести результаты модели SSDLite, описанной в статье MobileNetV2 (arXiv: 1801.04381), которая должна достичь около 22,1% мАП при вызове обнаружения COCO. Тем не менее, я застрял на 9% MAP. Это странное поведение, потому что модель работает несколько, но все еще далека от сообщенного результата. Может ли этот большой разрыв быть вызван выбором гиперпараметров / оптимизатора (я использую adam вместо sgd), или почти наверняка есть ошибка в моей реализации?

Стоит также упомянуть, что модель успешно подходит для небольшого подмножества тренировочного набора, но в целом тренировочный набор кажется, что потери достигают плато довольно быстро.

Кто-нибудь сталкивался с подобной проблемой?

1 Ответ

0 голосов
/ 11 января 2020

Может ли этот большой разрыв быть вызван гиперпараметрами / выбором оптимизатора (я использую Адам вместо sgd), или почти наверняка есть ошибка в моей реализации?

Даже небольшие изменения в гиперпараметрах и другой выбор оптимизатора могут сильно повлиять на тренировку и в результате точность классификатора. Так что ваша низкая точность может быть необязательной из-за ошибки, но также из-за неправильной параметризации.

Стоит также упомянуть, что модель успешно подходит для небольшого подмножества тренировочного набора, но в целом тренировочный набор, похоже, довольно быстро достигает плато.

Похоже, вы сталкиваетесь с локальным оптимумом, который работает только для подмножества ваших данных, который также может быть указателем для субоптимальной параметризации.

Как и упомянутый @Matias Valdenegro, для воспроизведения точного результата, который вы возможно, придется использовать те же параметры, что и в исходной реализации.

...