Обнаружение объекта, когда объект занимает небольшую часть изображения - PullRequest
3 голосов
/ 25 марта 2020

Я обучил сеть обнаружения дорожных знаков. В обучающих данных знак занимает весь кадр, например:

Training image example

Однако на изображениях, которые я хочу использовать для предсказаний, дорожные знаки занимают гораздо меньше места, например:

Actual data example

Прогнозы для таких изображений не очень хороши, однако, если я обрезаю только знак, предсказания хорошо.

Как мне go о создании прогнозов для больших изображений?

К сожалению, я не смог найти ответ на подобные вопросы.

1 Ответ

2 голосов
/ 25 марта 2020

Звучит так, как будто вы пытаетесь решить проблему другого рода, когда хотите расширить классификацию отдельных признаков, чтобы «обнаружить» их и классифицировать их внутри большого изображения.

У вас есть (в минимум) пара опций:

  • Создать скользящее окно, которое подметает изображение и делает классификацию каждого шага. Таким образом, когда вы нажмете на знак, он вернет хорошую классификацию. Но вы быстро поймете, что это не очень практично или эффективно. Размер окна и размер шага становятся дополнительными параметрами для оптимизации, и, как вы увидите в следующей опции, есть методы определения объекта c, которые уже пытаются решить эту проблему c.
  • Вы можете попробовать архитектуру обнаружения объектов. Это потребует от вас создания учебного набора данных, отличного от того, который вы использовали в классификации изображений. Вам понадобится много (сотни или тысячи) «больших» версий вашего изображения, которые содержат (а в некоторых случаях не содержат) знаки, которые вы хотите идентифицировать. Вам понадобится инструмент аннотации, чтобы найти и пометить эти знаки, а затем вы можете обучить сеть, чтобы найти и пометить их.

Некоторые архитектуры для поиска этого второго варианта включают: YOLO, Обнаружение одиночного выстрела (SSD), более быстрый RCNN, если назвать несколько.

...