Обнаружение объекта CNN и обучение с изображениями с водяными знаками, это будет работать? - PullRequest
0 голосов
/ 18 апреля 2019

Мне было интересно, тренирует ли CNN, например, YOLO, для задач обнаружения объектов панд, используя изображения с водяными знаками (с водяным знаком 1. под изображением или 2. над ним или 3. diffused ) может значительно повлиять на точность модели при тестировании на изображениях без водяных знаков.

Кроме того, более конкретно, если водяной знак находится на изображении, но за пределами области объектаЯ хочу определить (например, пример 1. или, в конце концов, 3.), как это повлияет на конечный результат?

Спасибо

Ответы [ 2 ]

1 голос
/ 19 апреля 2019

YOLO, вероятно, сможет решить проблему шума, но все же это не лучший набор данных, который вы можете сделать.Для большей точности я предлагаю вам использовать модель YoloV3-SPP (Spatial Pyramid Pooling).Вы можете использовать модель SPP из этого популярного репо https://github.com/AlexeyAB/darknet.

В darknet/cfg/yolov3-spp.cfg вы можете видеть, что есть добавление блока SPP:

### SPP ### 
 [maxpool] 
 stride=1 
 size=5 

 [route] 
 layers=-2 

 [maxpool] 
 stride=1 
 size=9 

 [route] 
 layers=-4 

 [maxpool] 
 stride=1 
 size=13 

 [route] 
 layers=-1,-3,-5,-6 

 ### End SPP ### 

SPP использует понижающую дискретизацию (шаг = 2)в сверточных слоях + используйте 3 разных пула максимального размера для одного и того же изображения и получите лучшие функции в слоях Max-Pooling.Я думаю, что добавление слоя Max pooling уменьшит некоторые шумы на изображении, выбрав только максимальные значения и важные функции из изображения.

1 голос
/ 18 апреля 2019

Из опыта я бы сказал, что YOLO должен справиться с этим уровнем шума. Рассматривая ваши дела:

  1. Это не должно быть проблемой. Некоторые тренировочные процедуры на самом деле включают черно-белые границы изображения для достижения правильного разрешения без растяжения изображений.

  2. и 3. Это может быть проблемой, если водяной знак скрывает важные признаки, или хуже, если часть водяного знака связана с классом во время обучения.

Если водяной знак находится за пределами области объекта: YOLO имеет возможность изучать контекст по всему изображению, но пока вы придерживаетесь предварительно обученных моделей, с вами все будет в порядке.

...