Допустим, что вывод YOLO состоит из 19 на 19 ячеек сетки, и каждая ячейка сетки имеет некоторую глубину.Каждая ячейка сетки может обнаруживать некоторые ограничивающие рамки, максимальное количество которых зависит от конфигурации модели.Например, если одна ячейка сетки может обнаружить до 5 ограничивающих прямоугольников, модель может обнаружить всего 19x19x5 = 1805 ограничивающих прямоугольников.
Поскольку это число слишком велико, мы обучаем модель так, чтобы только ячейка сетки, которая содержит центр ограничивающей рамки внутри нее , предсказывает ограничивающую рамку с высокой достоверностью.Когда мы обучаем модель, мы сначала выясняем, где находится центр истинной ограничительной рамки, и обучаем модель так, чтобы ячейка сетки, содержащая центр, предсказывала ограничивающую рамку, подобную истинной с высокой вероятностью, и такую, чтобы другиеЯчейки сетки будут предсказывать ограничивающие прямоугольники с как можно более низкой вероятностью (когда вероятность ниже порогового значения, этот прогноз отбрасывается).
На рисунке ниже показана ячейка сетки, содержащая центр ячейки, когда на выходе есть 13на 13 ячеек сетки.
То же самое, если на тренировочных изображениях более одного объекта.Если в обучающем образе есть два объекта, мы обновляем две ячейки сетки, которые содержат центры истинных двух прямоугольников, так что они создают ограничивающие прямоугольники с высокой вероятностью.