Набор данных разметки для MASK-RCNN: только хорошо видимые объекты? - PullRequest
0 голосов
/ 03 марта 2019

Я собираюсь использовать mark-rcnn (основанный на тензорном потоке), чтобы обнаружить некоторые автомобили и канистры с бензином.Изображения, которые у меня сейчас есть, содержат как автомобили, так и канистры.Но я не уверен насчет масок:

  1. Нужно ли полностью отмечать объект на изображении, или некоторые его части лучше не выделять (если это касается автомобилей или канистр с бензином) - еслина изображении есть несколько объектов одного типа, которые необходимо обнаружить, но они стоят один за другим и частично перекрывают друг друга (например, автомобили стоят на стоянке один за другим)
  2. Do iНужно ли маскировать каждую машину, даже если от машины есть небольшой кусочек, или мне нужно маскировать с определенным значением видимости (50%, 70%?) и т. д.?Или, может быть, лучше вообще избегать таких изображений и отмечать только те, на которых автомобили полностью видны?
  3. Какие еще требования предъявляются к архитектуре mask-rcnn, где их можно было бы изучить?
  4. Какая примерная конфигурация должна быть у компьютера для изучения маски rcnn на изображениях 1024x1024?

1 Ответ

0 голосов
/ 26 марта 2019

1) Я рекомендую вам просто пометить объект, который вы хотите обнаружить, если он перекрывает эту часть, не пометить его, используйте форму многоугольника для аннотации !!!!!

2) Лучше всего было бы попытаться отметить всю машину в каждой из ваших аннотаций, независимо от того, насколько она мала или велика.

3) Python, использование библиотек, я рекомендую вам использовать conda,и используйте для обучения tenorflow-gpu, это будет быстрее.

4) MaskRCNN имеет функцию, которая управляет этим, я думаю, вы можете найти в utils.py

def resize_image ():

эта функция изменяет размер изображения, сохраняя соотношение сторон без изменений

...