Повторение изображений в обучающем наборе данных для моделей обнаружения тензорных объектов - PullRequest
1 голос
/ 21 октября 2019

Я тренирую модель обнаружения объекта с тензорным потоком, которая была предварительно обучена с использованием COCO для распознавания одного типа / класса объектов. Некоторые изображения в моем наборе данных содержат несколько экземпляров таких объектов.

Учитывая, что каждая запись, используемая в обучении, имеет одну ограничивающую рамку, я задаюсь вопросом, каков наилучший подход к решению проблемы того, что мои изображения могут содержать более одного объекта одного класса.

  • Должен ли я использовать одно и то же изображение для нескольких записей?
  • Может ли это быть проблематичным при обучении?
  • Было бы лучше, если бы я мог разделить указанные изображения таким образом, чтобыони содержали только один объект?

1 Ответ

1 голос
/ 21 октября 2019

Стоит ли использовать одно и то же изображение для нескольких записей?

Нет, потому что все изображение, которое не аннотировано как объект, классифицируется как фон, который является неявным типом объекта/класс. Поэтому, когда вы тренируете модель с изображением, у которого есть объект, но этот объект не аннотирован правильно, производительность модели снижается (поскольку модель рассматривает этот объект и другие подобные объекты в качестве фона)

Может ли это быть проблематично при обучении?

Да, эта проблема может негативно повлиять на производительность модели. На самом деле, полезно добавить несколько изображений, в которых нет каких-либо объектов, и позволить модели обучаться на них в качестве фона без экземпляров ограничивающей рамки.

Будет ли этобыло бы лучше, если бы я мог разделить указанные изображения так, чтобы они содержали только один объект?

Да, это может помочь. Также вы можете рассмотреть возможность добавления нескольких ограничивающих рамок для каждого изображения. Но никогда не оставляйте объект без аннотированной ограничительной рамки, даже если объект обрезан или перекрыт.

...