Как описано в fast_rcnn_meta_arch.py , выходные тензоры должны иметь следующие формы:
detection_boxes: [batch, max_detection, 4]
detection_scores: [batch, max_detections]
detection_classes: [batch, max_detections]
num_detections: [batch]
Здесь bacth = 4
, max_detections = 100
и содержат все обнаруженияс различными показателями достоверности, поэтому вам может потребоваться выбрать пороговое значение для фильтрации обнаружений с низкими показателями достоверности. Кроме того, detection_boxes
содержит кодировки блоков в порядке ymin, xmin, ymax, xmax
и в нормализованных координатах.чтобы получить форму изображения, чтобы получить абсолютные координаты.
Например, скажем, вы хотите, чтобы все обнаружения были с score > 0.5
:
final_boxes = []
for i in range(int(num_detections)):
final_boxes.append(detection_boxes[i, detection_scores[i]>0.5, ])
Это даст вам обнаружения с показателем достоверности выше, чем0,5.