Обучение обнаружению объектов на больших изображениях - PullRequest
0 голосов
/ 29 апреля 2019

Попытка обнаружить номерные знаки с помощью более быстрого RCNN на изображениях 4096 на 8192 пикселей.

Вместо изменения размера для обучения я обрезал некоторые части изображения, пометил номерной знак и обучил. Таким образом, он работает, но не может обнаружить на реальных изображениях, а только на маленьких изображениях.

Пожалуйста, расскажите мне, как лучше всего добиться такой работы. Как я должен кормить обучение, и как должна быть конфигурация на fast_rcnn_inception_v2_pets.config . Или, если вы считаете, что более быстрый RCNN не подходит для такой работы, предложите лучший способ, мне нужна точность не менее 80%.

Я много искал в Google, но не смог найти никого, кто работал с изображениями выше 8k.

Я прилагаю пример изображения ниже. https://ibb.co/NKWWd7q


Я пытался провести аннотированное обучение для изображений 4096 на 8192 пикселей на облачных серверах Google, оно занимало более 250 ГБ ОЗУ в размере одного пакета.

С уважением.

1 Ответ

0 голосов
/ 30 апреля 2019

Вот мой ответ как сборник моих комментариев:

Кажется, ваши номерные знаки могут быть слишком маленькими по сравнению с остальной частью изображения.

Попробуйте сначала извлечь машину, например, с помощью YOLO, извлеките его, а затем снова запустите сеть обнаружения номерных знаков. Имейте в виду, что вам, возможно, придется отрегулировать ограничивающую рамку (размер извлеченного автомобиля) в соответствии с размером входного сигнала вашей сети.

Пример обнаружения автомобилей с YOLO можно найти здесь .

...