Voxnet-3D Object Detection - Выход сети - PullRequest
0 голосов
/ 30 октября 2018

Я пытаюсь реализовать Обнаружение объектов Voxnet -3D и не уверен насчет некоторых подробностей о выходных данных Региональной сети предложений (RPN). На рисунке ниже показан выходной сигнал RPN:

enter image description here

Я не уверен, каково значение «2» на карте оценки вероятности (обведено синим цветом) и «14» на карте регрессии (обведено синим цветом).
Насколько я понимаю, в карте регрессии (см. Рисунок выше) мы получаем H '/ 2 * W' / 2 * 14, поскольку 14 представляет два трехмерных якорных блока (7 значений: x, y, z, l, w, h, theta , для каждого из 3D-боксов). Таким образом, для каждой ячейки H '/ 2 * W' / 2 мы получаем значения 2 якорных ящиков.
Что касается карты оценки вероятности, мы получаем H '/ 2 * W' / 2 * 2, потому что 2 представляет значение вероятности для каждого из двух якорей. Я прав насчет этого?

Если мое понимание верно, то это означает, что мы только предсказываем оценку вероятности (на карте оценки вероятности), существует ли объект или нет? Это означает, что нет вероятностей классов. Поскольку для этого выбора есть два разных режима для Обнаружения автомобилей и Пешеходов / Велосипедистов, мое объяснение имеет смысл. То есть, если мы находимся, скажем, в режиме обнаружения автомобилей, мы только проверяем, существует ли объект (автомобиль) или нет. Таким образом, нам не нужны классовые вероятности. Пожалуйста, поправьте меня, если я ошибаюсь.

...