Я использовал API обнаружения объектов Google TensorFlow для обучения на собственном наборе данных с использованием модели Faster RCNN inception v2. Он работает нормально, с хорошей точностью и предсказал 11 классов для изображения. Теперь я хочу распечатать координаты ограничивающих рамок этих 11 классов. Код выглядит следующим образом:
vis_util.visualize_boxes_and_labels_on_image_array(
image,
np.squeeze(boxes),
np.squeeze(classes).astype(np.int32),
np.squeeze(scores),
category_index,
use_normalized_coordinates=True,
line_thickness=0,
min_score_thresh=0.60,
skip_scores=True)
Когда я печатаю коробки, я получаю что-то вроде этого:
array([[[0.32669118, 0.6601782 , 0.38314825, 0.68400425],
[0.39184284, 0.553997 , 0.44553113, 0.5834948 ],
[0.38940594, 0.53128403, 0.44362026, 0.55022514],
...,
[0.4089021 , 0.7232127 , 0.45374575, 0.7431895 ],
[0.3923106 , 0.42884094, 0.43902478, 0.44683832],
[0.31146154, 0.5427678 , 0.36749992, 0.5669152 ]]], dtype=float32)
Я считаю, что это координаты ограничивающего прямоугольника всех возможных прогнозов, но я нужна ограничивающая рамка только для этих 11 классов.
Кто-нибудь может мне помочь. Заранее спасибо!