Сетки YOLO используются для обнаружения нескольких объектов, тогда почему бы не рассматривать все изображение как большую сетку? - PullRequest
0 голосов
/ 30 апреля 2020

Итак, я понимаю, что YOLO сворачивает все изображение, но я не уверен, почему мы должны использовать сетки для обнаружения нескольких объектов (по крайней мере, во многих статьях, которые я читал, говорилось об этом?). Если сеть может быть спроектирована для обнаружения нескольких объектов из сетки в виде сетки 13 * 13, это должно означать, что она может обнаруживать несколько объектов из большой сетки 1 * 1?

1 Ответ

1 голос
/ 01 мая 2020

Так что я думаю, что это ответ. Не стесняйтесь поправлять меня, если я ошибаюсь.

Сетка позволяет нам обнаруживать несколько объектов одного и того же класса. Допустим, это всего лишь 1 большая сетка, и у нас есть 2 класса, на выходе будет массив из 14 чисел (7 для первого класса и 7 для второго класса). У нас не может быть другого набора из 7 чисел. Принимая во внимание, что если мы разделим изображение на сетки SxS, теперь мы можем сделать максимальное SxS число предсказания объекта для каждого из 2 классов.

Я думаю, именно поэтому заявлено, что YOLO борется с объектами, находящимися близко друг к другу в группе: потому что, если размер сетки недостаточно мал, у вас будет 2 или более центральных точек одного и того же класса объектов в одной сетке, но вы получите только 1 предсказание центральной точки.

...