Тренировка Yolo для обнаружения моего пользовательского объекта с уже обрезанными изображениями - PullRequest
0 голосов
/ 01 мая 2019

У меня есть большой набор «яблочных» изображений различных форм, размеров, освещения, цвета и т. Д. Эти «яблочные» изображения были частью большого изображения с разных точек зрения.

Теперь я хочу научить Darknet обнаруживать «яблоки» в изображениях. Я не хочу проходить процесс аннотации, так как я уже вырезала готовые изображения яблок в формате jpg.

Могу ли я использовать эти готовые и обрезанные "яблочные" изображения для обучения Darknet или мне все еще нужно пройти процесс аннотации?

Ответы [ 2 ]

2 голосов
/ 01 мая 2019

В моделях обнаружения объектов вы аннотируете объект на изображении, потому что он поймет, где находится объект на определенном изображении. Если у вас есть весь набор данных, содержащий только изображения яблок, модель узнает таким образом, что каждое предоставленное вами изображение будет содержать только яблоко. Поэтому, даже если вы предоставите «оранжевый» в качестве тестового изображения, он все равно может дать яблоко, потому что он не знает другого класса, кроме яблока.

Итак, есть два важных момента, которые следует учитывать:

  1. Имейте набор данных таким образом, чтобы в нем были яблоки, яблоки с другими фруктами или другие предметы. Это поможет модели четко понять, что такое яблоко.
  2. Поскольку координаты ограничивающего прямоугольника являются входными данными для обнаружения, хотя вы можете указать регулярные размеры изображения в качестве ограничивающего прямоугольника, оно не будет эффективно обучаться, как упомянуто выше. Следовательно, имейте несколько объектов на изображении, а затем хорошо комментируйте, чтобы модель могла хорошо учиться
0 голосов
/ 05 июня 2019

Ваш ответ относится к процессу, который мы назвали «Увеличение данных».Вы можете гуглить, как это делают другие.

Поскольку все ваши изображения яблок готовы, вы можете предположить, что все изображения яблок уже помечены в полном размере.Затем соберите несколько фоновых изображений, размеры которых больше, чем у любого из ваших яблочных изображений.И теперь вы можете написать инструмент для случайного выбора изображения яблока и объединения его с произвольно выбранным фоном для создания «новых» изображений яблока с фоном.Поскольку вы должны знать размер каждого изображения яблока, вы можете определенно рассчитать размер ограничительной рамки и ее положение, а затем сгенерировать файл тегов.

...