Yolo Training: несколько объектов в одном изображении - PullRequest
1 голос
/ 02 августа 2020

У меня есть набор обучающих изображений, которые содержат много мелких объектов (10-20). Разрешение изображения высокое (9000x6000).

Лучше ли разбить изображение на определенные c объекты перед запуском тренировки йоло? Или просто оставьте все как есть.

Изменяет ли yolo размер всего изображения или сначала «извлекает» аннотированный объект перед изменением размера?

Если это первое, меня беспокоит, что разрешение будет плохим. Представьте себе 20 объектов на изображении 416x416.

1 Ответ

0 голосов
/ 03 августа 2020

Изменяет ли yolo размер всего изображения или он «извлекает» аннотированный объект перед изменением размера?

Да, в случае Yolo размер всего изображения будет изменен, и это произойдет не извлекать аннотированный объект перед изменением размера.

Поскольку ваши входные изображения имеют очень высокое разрешение, вы можете сделать следующее:

  • Yolo может обрабатывать объект размеры 25 x 25 эффективно с размером сетевого входного слоя 608 x 608. Поэтому, если размеры ваших объектов в исходном входном изображении больше 250 x 250, вы можете обучать изображения, как они есть (с размером сети 608 x 608). В этом случае, даже если размер изображений будет изменен до размера сети, объекты будут иметь размер больше 25x25. Это должно дать вам хорошую точность. (6000/600) * 25 = 250

  • Если размеры объектов в исходных изображениях меньше, чем 200 x 200, разделите входное изображение на 8 меньших единиц / блоков, скажем, блоков / фрагментов 2250 x 1500. Обучайте эти блоки как отдельные изображения. Каждому большему изображению (9000 x 6000) соответствует 8 обучающих изображений. Каждое изображение может содержать от нуля до многих объектов. Вы можете использовать метод скользящего окна.

  • Метод, который вы выбираете для обучения, также должен использоваться для вывода.

Для для обучения на объектах всех размеров используйте следующие модели: [Используйте это, если вы используете исходное изображение, поскольку оно используется для обучения]

Если все объекты, которые вы хотите обнаружить, имеют меньший размер , затем для эффективного обнаружения используйте Yolov4 со следующими изменениями: [Используйте это, если исходное изображение разбито на 8 блоков]

Ссылки:

  • См. этот соответствующий поток GitHub
  • dar knet документация
...