Создание пользовательских моделей обнаружения объектов - PullRequest
1 голос
/ 07 апреля 2020

Я тестирую ImageAI модели обнаружения объектов, такие как RetinaNet и YOLOv3 для наборов данных изображений. Но проблема в том, что эти модели поддерживают только 80 различных типов объектов, как показано ниже:

person,  bicycle,  car, motorcycle, airplane, bus, train,  truck,  boat,  traffic light,  fire hydrant, stop_sign,
parking meter,   bench,   bird,   cat,   dog,   horse,   sheep,   cow,   elephant,   bear,   zebra,
giraffe,   backpack,   umbrella,   handbag,   tie,   suitcase,   frisbee,   skis,   snowboard,
sports ball,   kite,   baseball bat,   baseball glove,   skateboard,   surfboard,   tennis racket,
bottle,   wine glass,   cup,   fork,   knife,   spoon,   bowl,   banana,   apple,   sandwich,   orange,
broccoli,   carrot,   hot dog,   pizza,   donot,   cake,   chair,   couch,   potted plant,   bed,
dining table,   toilet,   tv,   laptop,   mouse,   remote,   keyboard,   cell phone,   microwave,   oven,
toaster,   sink,   refrigerator,   book,   clock,   vase,   scissors,   teddy bear,   hair dryer,   toothbrush.
  • Объекты (преобразователи) в моем наборе данных отличаются от поддерживаемых выше объектов. Каков наилучший способ create custom object detection models?
  • Если мне нужно создать собственный набор данных, сколько изображений достаточно, чтобы получить хорошую точность?

enter image description here

Ответы [ 2 ]

1 голос
/ 08 апреля 2020

Множество людей хотят сделать это с помощью специального обнаружения объектов. Ответ от Nandu Raj - отличный ресурс, если вы хотите работать непосредственно со своим собственным оборудованием с графическим процессором, установить TensorFlow и управлять всем самостоятельно.

Однако, если вам нужна услуга, я бы предложил продукт, над которым работал , IBM Watson Visual Recognition. Это облачный сервис, не требующий специальных знаний в области машинного обучения или аппаратного обеспечения. Вы используете Watson Studio для обучения своей собственной частной модели, рисуя прямоугольники вокруг объектов, которые вам интересны, примерно в 50 изображений, а затем нажимаете кнопку поезда. Количество необходимых примеров будет варьироваться в зависимости от типов объектов, которые вы хотите найти, конечно.

Однако вы можете начать работу очень быстро, например, отметив 20 изображений, а затем нажав «поезд». Уотсон сделает все возможное и обучит модель за 15-20 минут. Затем вы можете использовать функцию автоматической маркировки, чтобы эта предварительная модель предлагала поля для немаркированных изображений. Тогда ваша задача будет проще, вы просто исправляете все ненужные поля и нажимаете кнопку re-train.

Вот демонстрация, основанная на Le go people: https://medium.com/@vincent.perrin / watson- визуальное распознавание-обнаружение-в-действии-в-действии-5-минут-8f97c4b613c3 Не пропустите ссылку GitHub на примеры данных, если вы хотите, чтобы они вращались.

Это бесплатно Чтобы использовать до 1000 изображений в месяц - подпишитесь на план "Lite":

Видео-демонстрация GUI с Studio: https://www.youtube.com/watch?v=eW6_PCYFq-Y Если вы предпочитаете использовать curl или Python SDK, начните здесь: https://cloud.ibm.com/docs/visual-recognition?topic=visual-recognition-getting-started-tutorial

1 голос
/ 07 апреля 2020

Выполните шаги, упомянутые здесь.:

1002 *https://github.com/EdjeElectronics/TensorFlow-Object-Detection-API-Tutorial-Train-Multiple-Objects-Windows-10

Это будет хорошим началом

...