Вы можете использовать MASK-RCNN, я рекомендую это двухэтапный фреймворк, сначала вы можете сканировать изображение и генерировать области, которые, вероятно, содержат объект.И второй этап классифицирует предложение, рисуя ограничивающие рамки.
Но два больших вопроса
как обучить модель с нуля?И что происходит, когда мы хотим обучить наш собственный набор данных?
Вы можете использовать аннотации, загруженные из Интернета, или вы можете начать создавать свои собственные аннотации, это занимает много времени!
У вас есть такие инструменты, как:
VIA GGC-аннотатор изображений http://www.robots.ox.ac.uk/~vgg/software/via/via_demo.html
он-лайн, и вам не нужно скачивать никакие программы.Это тот, который я рекомендую вам, сохраняйте изображения в файле .json, и поэтому вы можете использовать класс баллонов, который поставляется по умолчанию в SAMPLES в рамках MASK R-CNN, вам нужно только поместить свой файл jsonи ваши изображения и обучать ваш набор данных.
Но всегда есть больше опций, у вас есть labellimg , который также используется для аннотаций и очень хорошо известен, но сохраните файлы в XML, вам придется внести несколько изменений в свойКласс на питоне.У вас также есть labelme, labelbox и т. Д.