Понимание деформируемого детектора объектов на основе деталей - PullRequest
0 голосов
/ 28 апреля 2020

Я пытаюсь разобраться в деталях работы «Обнаружение объектов с помощью моделей, основанных на дискриминационной тренировке», доступ к которой можно получить по по этой ссылке

Уравнение (2) определяет оценку для объектная гипотеза. Он использует пространственный априор, который вычисляет расстояния между позицией root (x_0, y_0), позицией части i (x_i, y_i) на некотором уровне l в пирамиде объектов и позицией привязки v_i для части i относительно позиция root.

Мой вопрос сейчас, каково именно определение v_i? Это координаты (x_i, y_i), когда начало координат находится в точке (x_0, y_0)? В частности, это будет означать, что если (x_0, y_0) = (0,0), то v_i = (x_i, y_i).

Глядя на уравнение (3), если (x_0, y_0) = ( 0,0), мы бы имели (dx_i, dy_i) = (x_i, y_i) - (2 * (0,0) + v_i) = (x_i, y_i) - (x_i, y_i) = (0,0), поэтому я предполагаю, что подразумевается что-то еще.

Кроме того, v_i - это просто функция (x_i, y_i) и (x_0, y_0) или независимая переменная, которая должна быть выведена в части оптимизации?

...