YOLO и настройка количества якорных ящиков для пользовательского набора данных - PullRequest
0 голосов
/ 05 июня 2018

Я работаю над реализацией YOLO v2 и 3 для обнаружения объектов в пользовательском наборе данных.В то время как YOLO v2 и 3 используют что-то вроде 5 или около того якорных ящиков, у меня обычно может быть 50-100 обнаружений каждого изображения.Я чувствую, что если есть только 5 якорных ящиков, то не более 5 обнаружений на изображение не так ли?Поэтому я пытался понять, нужно ли мне настроить количество якорных ящиков в моем наборе данных.

Мои вопросы: должно ли количество якорных ячеек быть больше, чем максимальное количество ограничивающих ящиков в любом тренировочном образе? Таким образом, я бы никогда не столкнулся с обнаружениями там, где естьнет соответствующей якорной коробки.Это правильный образ мышления об адаптации YOLO?

Если моя интуиция верна, то мне нужно будет выполнить k-средства, чтобы сгруппировать ограничивающие прямоугольники в наземных изображениях истинности и установить координаты якорного прямоугольника.Тогда я бы использовал обычный метод регрессии, как указано в этом сообщении в блоге .

Спасибо за любую помощь, которую может оказать каждый.

Ответы [ 2 ]

0 голосов
/ 18 декабря 2018

Количество якорных ящиков частично влияет на количество обнаруженных ящиков.

Выход YOLOv2 имеет форму (13, 13, B * (5 + C)), где B - количество якорей привязки , а C - количество классов, которые выпытаясь обнаружить.Таким образом, выход имеет 13 * 13 = 169 ячеек сетки .Вы можете думать о них как о делении входного изображения на 13 на 13 ячеек.

Каждая ячейка сетки может обнаружить не более B объектов или связующих коробок.Количество связующих блоков, которые обнаруживает ячейка сетки, зависит от ее значений достоверности .Каждый B ограничивающих прямоугольников ячейки сетки имеет достоверность, которая находится между 0 и 1. Если достоверность прямоугольника превышает пороговое значение , сеть, наконец, сообщает нам, что прямоугольник (или объект) обнаружено .

Предположим, что ячейка сетки имеет следующие значения достоверности, а пороговое значение равно 0,1.

[0,02, 0,3, 0,001, 0,9, 0,03] (B = 5)

В этом случае эта ячейка сетки обнаруживает 2 блока и отбрасывает другие 3 блока с небольшим доверием.

Поэтому, если вы хотите уменьшить количество обнаруженных блоков, Рекомендую увеличить порог .

The output of the network looks like this. There are 13x13 = 169 grid cells in total, and each grid cell can detect up to B bounding boxes. One bounding box has 5 + C properties, therefore a grid cell has D = Bx(5+C) values (this is depth).

0 голосов
/ 06 июня 2018

Мне кажется, что если имеется только 5 якорных ячеек, то на каждое изображение может быть не более 5 обнаружений, верно?

Есть пять якорных ячеек для каждой ячейки предсказания, а не длявсе изображение.Давайте рассмотрим Yolo v2, где входное изображение имеет размер 416x416x3, а вывод - 13x13xN.Каждый из 13x13 соответствует области ячейки 32x32 во входном изображении (как показано на рисунке ниже из поста в блоге), и для каждой из ячеек 13x13 определены 5 якорей.Таким образом, технически вы можете иметь ограничивающие рамки 13x13x5 для изображения размером 416x416 (вы можете тренироваться и с большими изображениями, так как yolo v2 является полностью сверточной сетью, а затем вы получаете больше областей ячеек).enter image description here

Допустим, у вас есть 50 ограничивающих рамок на вашем изображении, каждый из ограничивающих рамок должен быть назначен ячейке на основе того, насколько близко центр ограничивающей рамки находится ксотовый центр.Теперь для этой ячейки выберите одну из 5 якорных ячеек, которая дает наилучшие долговые расписки.Для каждой ячейки создайте метку, которая должна содержать доверительные оценки, а также положение и размер ячеек всех 5 якорных ячеек (за исключением выбранного якорного ящика, другие будут помечены как ноль) вместе с оценками классов.

На карте- означает кластеризацию, упомянутую в ссылке, она описывает, как они достигли пяти якорных ящиков.Лучше просто придерживаться 5 ограничивающих рамок, если у вас нет особых причин включать больше или иметь разные формы, если возникает какое-то конкретное требование.

...