Концептуальный вопрос об алгоритме обнаружения объектов Yolo - PullRequest
0 голосов
/ 04 октября 2018

Насколько я понимаю, мотивация якорных ящиков (в алгоритме Yolo v2) заключается в том, что в первой версии Yolo (Yolo v1) невозможно обнаружить несколько объектов в одном блоке сетки.Я не понимаю, почему это так.

Кроме того, в оригинальной статье авторов (Yolo v1) есть следующая цитата:

"Каждая ячейка сетки предсказывает ограничивающие рамки B и оценки достоверности для этих блоков. Эти оценки достоверности отражают степень уверенностимодель состоит в том, что блок содержит объект, а также то, насколько точно он считает, что блок прогнозирует. "

Не означает ли это, что ячейка сетки может распознавать более одного объекта?В их статье они принимают B как 2. Почему бы не взять B как какое-то произвольно большее число, скажем, 10?

Второй вопрос: как размеры якорного ящика связаны с размерами ограничивающего ящика для обнаружения конкретного объекта?Некоторые веб-сайты говорят, что Anchor Box определяет только форму, а другие говорят, что она определяет форму и размер.В любом случае, как Якорная Коробка привязана к Ограничительной Коробке?

Спасибо, Сандип

1 Ответ

0 голосов
/ 07 октября 2018

Вы правы в том, что YOLOv1 имеет несколько (B) ограничивающих рамок, но они не назначены для истинных оснований эффективным или систематическим образом, и поэтому также не выводят ограничивающие рамки достаточно точно.

Как вы можете читать в сообщениях блога через Интернет, Якорь / Ящик по умолчанию - это ящик в исходном изображении, который соответствует определенной ячейке в конкретной карте объектов, которой назначены определенные пропорции и масштаб.,Масштаб обычно определяется картой объектов (более глубокая карта объектов -> большой масштаб привязки), а соотношение сторон может варьироваться, например, {1: 1, 1: 2, 2: 1} или {1: 1, 1: 2,2: 1, 1: 3, 3: 1}.По масштабу и соотношению сторон определяется конкретная форма, и эта форма с позицией, определяемой положением текущей ячейки на карте объектов, сравнивается с прямоугольниками, ограничивающими наземную истинность в исходном изображении.

Разные документы имеют разные схемы назначения, но обычно это выглядит так: (1) если IoU якоря на исходном изображении с GT превышает некоторый порог (например, 0,5), то это положительное назначение для якоря,(2) если он ниже некоторого порога (например, 0,1), то это отрицательное назначение, и (3) если есть разрыв между этими двумя порогами - тогда якоря между ними игнорируются (в вычислении потерь).

Таким образом, якорь фактически похож на «детекторную головку», ответственную за конкретные случаи, которые наиболее похожи на нее по форме.Поэтому он отвечает за обнаружение объектов с похожей по форме формой и выводит как достоверность для каждого класса, так и параметры ограничивающего прямоугольника относительно него , т. Е. Насколько можно изменить высоту, ширину и центр якоря (в двух осях), чтобы получить правильную ограничивающую рамку.

Из-за этой схемы назначения, которая эффективно распределяет ответственность между различными якорями, предсказание ограничительной рамки является более точным.

Еще один недостатокСхема YOLOv1 заключается в том, что она разделяет ограничивающую рамку и классификацию.С одной стороны, это экономит вычисления, но с другой - классификация находится на уровне ячейки сетки.Поэтому все варианты B для ограничивающих прямоугольников имеют одно и то же предсказание класса.Это означает, например, что если существует несколько объектов класса другого класса с одним и тем же центром (например, человек, держащий кошку), то классификация по крайней мере всех, кроме одного, будет неправильной.Обратите внимание, что теоретически возможно, что другие предсказания смежных ячеек сетки будут компенсировать эту неправильную классификацию, но это не обещано, в частности, поскольку по схеме YOLOv1 центром является критерий назначения.

...