Я пытаюсь обучить модель SSD безуспешно, для обнаружения отдельных символов, используя около 1000 обучающих и 200 проверенных изображений.
Обученная модель не может предсказать все тестовые случаи; ограничивающие рамки, кажется, генерируются случайным образом. Я прилагаю изображение кривых mAP для обучения и проверки.
Кажется, кривая валидации ведет себя хаотично, поэтому у меня есть пара вопросов:
- Почему диапазон мАП намного меньше для проверки, чем для обучения?
- Почему «зазубренность» и резкое падение валидации mAP?
Гиперпараметры устанавливаются следующим образом (с использованием пакета Python AWS Sagemaker):
base_network='vgg-16',
use_pretrained_model=1,
mini_batch_size=16,
epochs=600,
learning_rate=0.0001,
optimizer='rmsprop',
momentum=0.9,
image_shape=512,
label_width=350,
Есть мысли?
Изображение: кривые mAP для обучения и проверки