Я использовал API обнаружения тензорного объекта для обнаружения нескольких объектов в моих видео.Тем не менее, я изо всех сил пытался выяснить, как записать эти результирующие обнаружения объектов в текстовый файл / CSV / xml (в основном информацию ограничивающего прямоугольника, номер кадра последовательности изображений, достоверность bbox)
Я видел несколько ответов в stackoverflow и github, но большинство из них были либо расплывчатыми, либо я просто не смог получить точный ответ, который я ищу.
Ниже показана последняя часть кода обнаружения, я знаю, что мне нужны именно display_boxes и creation_scores, но я просто не могу понять, как записать их в текстовый файл, а также записать только последние определения bboxкоторые видны на изображениях, но не ВСЕ ограничивающие рамки обнаружения
for image_path in TEST_IMAGE_PATHS:
image = Image.open(image_path) # the array based representation of the image will be used later in order to prepare the result image with boxes and labels on it.
image_np = load_image_into_numpy_array(image) # Expand dimensions since the model expects images to have shape: [1, None, None, 3]
image_np_expanded = np.expand_dims(image_np, axis=0) # Actual detection.
output_dict = run_inference_for_single_image(image_np_expanded, detection_graph) # Visualization of the results of a detection.
vis_util.visualize_boxes_and_labels_on_image_array(
image_np,
output_dict['detection_boxes'],
output_dict['detection_classes'],
output_dict['detection_scores'],
category_index,
instance_masks=output_dict.get('detection_masks'),
use_normalized_coordinates=True,
line_thickness=8) plt.figure(figsize=IMAGE_SIZE)
plt.imshow(image_np)