Вы правы в том, что YOLOv1 имеет несколько (B) ограничивающих рамок, но они не назначены для истинных оснований эффективным или систематическим образом, и поэтому также не выводят ограничивающие рамки достаточно точно.
Как вы можете читать в сообщениях блога через Интернет, Якорь / Ящик по умолчанию - это ящик в исходном изображении, который соответствует определенной ячейке в конкретной карте объектов, которой назначены определенные пропорции и масштаб.,Масштаб обычно определяется картой объектов (более глубокая карта объектов -> большой масштаб привязки), а соотношение сторон может варьироваться, например, {1: 1, 1: 2, 2: 1} или {1: 1, 1: 2,2: 1, 1: 3, 3: 1}.По масштабу и соотношению сторон определяется конкретная форма, и эта форма с позицией, определяемой положением текущей ячейки на карте объектов, сравнивается с прямоугольниками, ограничивающими наземную истинность в исходном изображении.
Разные документы имеют разные схемы назначения, но обычно это выглядит так: (1) если IoU якоря на исходном изображении с GT превышает некоторый порог (например, 0,5), то это положительное назначение для якоря,(2) если он ниже некоторого порога (например, 0,1), то это отрицательное назначение, и (3) если есть разрыв между этими двумя порогами - тогда якоря между ними игнорируются (в вычислении потерь).
Таким образом, якорь фактически похож на «детекторную головку», ответственную за конкретные случаи, которые наиболее похожи на нее по форме.Поэтому он отвечает за обнаружение объектов с похожей по форме формой и выводит как достоверность для каждого класса, так и параметры ограничивающего прямоугольника относительно него , т. Е. Насколько можно изменить высоту, ширину и центр якоря (в двух осях), чтобы получить правильную ограничивающую рамку.
Из-за этой схемы назначения, которая эффективно распределяет ответственность между различными якорями, предсказание ограничительной рамки является более точным.
Еще один недостатокСхема YOLOv1 заключается в том, что она разделяет ограничивающую рамку и классификацию.С одной стороны, это экономит вычисления, но с другой - классификация находится на уровне ячейки сетки.Поэтому все варианты B для ограничивающих прямоугольников имеют одно и то же предсказание класса.Это означает, например, что если существует несколько объектов класса другого класса с одним и тем же центром (например, человек, держащий кошку), то классификация по крайней мере всех, кроме одного, будет неправильной.Обратите внимание, что теоретически возможно, что другие предсказания смежных ячеек сетки будут компенсировать эту неправильную классификацию, но это не обещано, в частности, поскольку по схеме YOLOv1 центром является критерий назначения.