Обнаружение объектов YOLO, форма данных Y - PullRequest
0 голосов
/ 03 ноября 2018

Быстрое введение - я пытаюсь построить модель YOLO в тензорном потоке. Я не могу найти форму y-выхода, который используется для обучения модели обнаружения и классификации объектов YOLO. Скажем для примера, что форма прогнозируемых значений (13,13,2,7), где есть 13x13 ячеек, каждая с двумя догадками, соответствующими форме 7x1. Это предположение 7x1 (is_obj_in_cell, x_mid, y_mid, ширина, длина, prob_cat, prob_dog).

Насколько мне известно, есть два варианта:

1) Форма y имеет вид (13,13,7), что, по-видимому, имеет смысл, поскольку функция потерь YOLO требует оценки IoU всех предсказаний ограничивающего прямоугольника (в этом примере 2 догадки)

2) Форма y имеет вид (13, 13, 2, 7), где y будет несколько «жестко закодировано», с каким прогнозом должен соответствовать какой тип ограничительной рамки (то есть ширина> длина, длина <= ширина и т. Д. .) Хотя это имеет смысл, это будет означать, что любое суммирование по прогнозам ограничивающего прямоугольника не будет иметь смысла, поскольку у строго определено. </p>

Может кто-нибудь помочь мне разобраться в этом?

...