Question

Итак, я понимаю, что YOLO сворачивает все изображение, но я не уверен, почему мы должны использовать сетки для обнаружения нескольких объектов (по крайней мере, во многих статьях, которые я читал, говорилось об этом?). Если сеть может быть спроектирована для обнаружения нескольких объектов из сетки в виде сетки 13 * 13, это должно означать, что она может обнаруживать несколько объектов из большой сетки 1 * 1?

NatalieL · Answer 1 · 01 мая 2020

Так что я думаю, что это ответ. Не стесняйтесь поправлять меня, если я ошибаюсь.

Сетка позволяет нам обнаруживать несколько объектов одного и того же класса. Допустим, это всего лишь 1 большая сетка, и у нас есть 2 класса, на выходе будет массив из 14 чисел (7 для первого класса и 7 для второго класса). У нас не может быть другого набора из 7 чисел. Принимая во внимание, что если мы разделим изображение на сетки SxS, теперь мы можем сделать максимальное SxS число предсказания объекта для каждого из 2 классов.

Я думаю, именно поэтому заявлено, что YOLO борется с объектами, находящимися близко друг к другу в группе: потому что, если размер сетки недостаточно мал, у вас будет 2 или более центральных точек одного и того же класса объектов в одной сетке, но вы получите только 1 предсказание центральной точки.

Сетки YOLO используются для обнаружения нескольких объектов, тогда почему бы не рассматривать все изображение как большую сетку?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Сетки YOLO используются для обнаружения нескольких объектов, тогда почему бы не рассматривать все изображение как большую сетку?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы