Я пытаюсь расшифровать вывод YOLOv3-tiny, сделанный для вывода с использованием набора инструментов Intel OpenVINO. Я слежу за их демонстрационным кодом, который получает 2 выходных двоичных объекта. Один из них имеет размер: (1,255,13,13). Это не похоже на вывод v2, который был похож на (1,13,13,425).
Я понимаю, что 255 в v3 и 425 в v2 вызваны разным количеством якорей в обоих, но проблема в следующем:
Результат v2 может быть декодирован без выравнивания этого blob, тогда как в v3 демонстрация показывает, что они сглаживают его, а затем используют таинственные магические методы для извлечения координат ящика и других параметров.
Я не могу понять, как расположение матрицы / массива могло изменить подход к проблеме? Я имею в виду, как они решают, можно ли извлечь желаемые результаты, используя вложенные циклы for до go глубже в массив или сглаживая его, а затем просматривая значения.