Я пытаюсь понять, как интерпретировать вывод yolov2.
Я преобразовал yolo.cft & yolo.weights в yolo.h5, который является моделью Keras.
Затем я запускаю model.predict(img)
который дает мне вывод с формой (1, 19, 19, 425).
Насколько я знаю, интерпретация этой формы:
Изображение разделено для ячейки сетки 19x19
425 равно 5 x 85, где 5 - количество якорных ящикови 85 - это (isObject, Boxx, Boxy, Boxw, Boxh, class1, class2, ..., class80).
Но мне интересно, как я могу прочитать эти данные?Или есть что делать с выводом перед чтением?
Например:
output_data = model.predict(img)
это output_data[0][0][0][0]
проверка, если в поле [0, 0]
в anchor_box 0 естьлюбой объект?Тогда output_data[0][0][0][1:4]
связывает данные с ограничивающими рамками, а output_data[0][0][0][5:85]
говорит мне, какой класс в ячейке?Мои подозрения верны или я совершенно неправ?
Заранее спасибо, кстати.Я использовал форму файла cfg здесь