Я пытаюсь обучить Маску R CNN с моим собственным набором данных. Сначала я нашел готовый набор данных bottle (70 изображений) и обучил модель 10 эпохам. Точность была почти идеальной. Когда я тестировал со случайными изображениями, модель была потрясающей.
Then I prepared my own dataset from VGG-аннотатор изображений - robots.ox.a c .uk .
Моя цель - использовать сегментацию и обнаружение на автомобилях и дорогах. После того, как я тренировал свою модель в течение 30 эпох, точность была ужасной, и она не могла даже обнаружить 1 дорогу или объект по тестовым изображениям. Затем я удалил дорожную метку из своего набора данных и подготовил модель для обнаружения только автомобилей, но моя модель также не смогла это сделать.
Итак, что я могу сделать неправильно при подготовке набора данных?
У меня есть изображения с разных высот. Может они все должны быть почти одинаковыми?
Хорошо ли рисовать такую дорогу? Или я должен разделить его на части?
Хорошо ли маркировать эти дороги, на которых тонны автомобилей?
Должен ли я рисовать коробки больше или меньше?
Должен ли я рисовать прямоугольники, даже если на изображении только половина автомобиля?
Должен ли я подготовить различные изображения для автомобилей и дорог ?. Может быть, дороги должны быть пусты, на них не должно быть машин? Я не знаю.
Спасибо за ваше время, хорошего дня.