Как получить координаты предсказанных ограничивающих рамок в API обнаружения объектов Tensorflow? - PullRequest
0 голосов
/ 08 мая 2020

Я использовал API обнаружения объектов Google TensorFlow для обучения на собственном наборе данных с использованием модели Faster RCNN inception v2. Он работает нормально, с хорошей точностью и предсказал 11 классов для изображения. Теперь я хочу распечатать координаты ограничивающих рамок этих 11 классов. Код выглядит следующим образом:

vis_util.visualize_boxes_and_labels_on_image_array(
image,
np.squeeze(boxes),
np.squeeze(classes).astype(np.int32),
np.squeeze(scores),
category_index,
use_normalized_coordinates=True,
line_thickness=0,
min_score_thresh=0.60,
skip_scores=True)

Когда я печатаю коробки, я получаю что-то вроде этого:

array([[[0.32669118, 0.6601782 , 0.38314825, 0.68400425],
    [0.39184284, 0.553997  , 0.44553113, 0.5834948 ],
    [0.38940594, 0.53128403, 0.44362026, 0.55022514],
    ...,
    [0.4089021 , 0.7232127 , 0.45374575, 0.7431895 ],
    [0.3923106 , 0.42884094, 0.43902478, 0.44683832],
    [0.31146154, 0.5427678 , 0.36749992, 0.5669152 ]]], dtype=float32)

Я считаю, что это координаты ограничивающего прямоугольника всех возможных прогнозов, но я нужна ограничивающая рамка только для этих 11 классов.

Кто-нибудь может мне помочь. Заранее спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...