Разница между (1,255,13,13) и (1,13,13,255) в контексте вывода YOLO - PullRequest
0 голосов
/ 07 мая 2020

Я пытаюсь расшифровать вывод YOLOv3-tiny, сделанный для вывода с использованием набора инструментов Intel OpenVINO. Я слежу за их демонстрационным кодом, который получает 2 выходных двоичных объекта. Один из них имеет размер: (1,255,13,13). Это не похоже на вывод v2, который был похож на (1,13,13,425).

Я понимаю, что 255 в v3 и 425 в v2 вызваны разным количеством якорей в обоих, но проблема в следующем:

Результат v2 может быть декодирован без выравнивания этого blob, тогда как в v3 демонстрация показывает, что они сглаживают его, а затем используют таинственные магические методы для извлечения координат ящика и других параметров.

Я не могу понять, как расположение матрицы / массива могло изменить подход к проблеме? Я имею в виду, как они решают, можно ли извлечь желаемые результаты, используя вложенные циклы for до go глубже в массив или сглаживая его, а затем просматривая значения.

...