Допустим, что вывод YOLO состоит из 19 на 19 ячеек сетки, и каждая ячейка сетки имеет некоторую глубину.Каждая ячейка сетки может обнаруживать некоторые ограничивающие рамки, максимальное количество которых зависит от конфигурации модели.Например, если одна ячейка сетки может обнаружить до 5 ограничивающих прямоугольников, модель может обнаружить всего 19x19x5 = 1805 ограничивающих прямоугольников.
Поскольку это число слишком велико, мы обучаем модель так, чтобы только ячейка сетки, которая содержит центр ограничивающей рамки внутри нее , предсказывает ограничивающую рамку с высокой достоверностью.Когда мы обучаем модель, мы сначала выясняем, где находится центр истинной ограничительной рамки, и обучаем модель так, чтобы ячейка сетки, содержащая центр, предсказывала ограничивающую рамку, подобную истинной с высокой вероятностью, и такую, чтобы другиеЯчейки сетки будут предсказывать ограничивающие прямоугольники с как можно более низкой вероятностью (когда вероятность ниже порогового значения, этот прогноз отбрасывается).
На рисунке ниже показана ячейка сетки, содержащая центр ячейки, когда на выходе есть 13на 13 ячеек сетки.
![enter image description here](https://i.stack.imgur.com/0yT30.png)
То же самое, если на тренировочных изображениях более одного объекта.Если в обучающем образе есть два объекта, мы обновляем две ячейки сетки, которые содержат центры истинных двух прямоугольников, так что они создают ограничивающие прямоугольники с высокой вероятностью.