Определение положения якорных блоков в исходном изображении с использованием карты объектов с пониженной дискретизацией - PullRequest
0 голосов
/ 13 января 2020

Из того, что я прочитал, я понимаю, что методы, используемые в более быстрых RCNN и SSD, включают генерацию набора якорных ящиков. Сначала мы снимаем тренировочное изображение, используя CNN, и для каждого пикселя на карте объектов с пониженной дискретизацией (которая будет являться центром для наших якорных ящиков) мы проецируем его обратно на тренировочное изображение. Затем мы рисуем якорные блоки, центрированные вокруг этого пикселя, используя наши заранее определенные масштабы и rat ios. Чего я не понимаю, так это почему мы не принимаем непосредственно центры наших якорных ячеек на тренировочном изображении с подходящим шагом и используем CNN только для вывода значений классификации и регрессии. Что мы получаем, используя CNN, чтобы определить центры наших якорных ящиков, которые в конечном итоге будут равномерно распределены на тренировочном образе?

Чтобы более четко заявить -

Где будут центры наши якорные поля находятся на тренировочном образе до нашего первого предсказания значений смещения, и как мы их решаем?

1 Ответ

1 голос
/ 13 января 2020

Я думаю, что путаница возникает из-за этого:

Что мы получаем, используя CNN для определения центров наших якорных ящиков, которые в конечном итоге будут равномерно распределены по тренировочному образу

Сеть обычно не предсказывает центры, но исправляет их по предварительному мнению. Начальные опорные центры распределены равномерно по всему изображению, и поэтому не достаточно плотно прилегают к объектам сцены. Эти якоря просто составляют априор в смысле вероятности. То, что ваша сеть будет точно выводить, зависит от реализации, но, скорее всего, будет просто обновлением, т.е. исправлениями к этим начальным априорам. Это означает, что центрами, которые предсказаны вашей сетью, являются некоторые delta_x, delta_y, которые настраивают ограничивающие рамки.

Относительно этой части:

почему бы нам напрямую не принять центры наших якорных ячеек на тренировочном изображении с подходящим шагом и использовать CNN только для вывода значений классификации и регрессии

Значения регрессии должны по-прежнему содержать достаточную информацию для уникального определения ограничивающего прямоугольника. Прогнозирование ширины, высоты и смещений центра (поправок) - это простой способ сделать это, но это, конечно, не единственный способ. Например, вы можете изменить сеть так, чтобы она предсказывала каждый пиксель, вектор расстояния до его ближайшего центра объекта или вы могли использовать параметры c. Однако грубые фиксированные якорные центры не являются хорошей идеей, поскольку они также вызовут проблемы при классификации, так как вы используете их для объединения объектов, представляющих объект.

...