Google Cloud AutoML Object Detection экспортирует позиции объектов CSV - PullRequest
0 голосов
/ 20 марта 2020

Я пометил объекты на изображениях с помощью инструмента Google Cloud AutoML. Чем я экспортировал CSV-файл. Вот вывод:

TRAIN,gs://optik-vcm/optikic/80-2020-03-19T11:58:25.819Z.jpg,kenarcizgi,0.92590326,0.035908595,0.9589712,0.035908595,0.9589712,0.9020675,0.92590326,0.9020675

По красоте это так:

TRAIN
gs://optik-vcm/optikic/80-2020-03-19T11:58:25.819Z.jpg
kenarcizgi
0.92590326
0.035908595
0.9589712
0.035908595
0.9589712
0.9020675
0.92590326
0.9020675

Я знаю первые три столбца.

Я увеличу количество изображений, увеличив данные. Я буду использовать OpenCV в Python для этого. Но мне нужны координаты объектов на изображении.

Как я могу преобразовать эти десятичные дроби в координаты пикселей? Или есть какой-то расчет для этого?

1 Ответ

1 голос
/ 24 марта 2020

Они называются NormalizedVertex .

Вершина представляет 2D точку на изображении. Нормализованные координаты вершин находятся в диапазоне от 0 до 1 относительно первоначальной плоскости (изображение, видео). Например, если плоскость (например, целое изображение) будет иметь размер 10 x 20, то точка с нормализованными координатами (0,1, 0,3) будет в положении (1, 6) на этой плоскости.

К получить координату пикселя, вы можете умножить это число на ширину или длину вашего ввода в зависимости от ситуации.


Вся ссылка для форматирования CSV объясняет, что следующее (усеченное) составляет каждую строку (по одной строке на ограничивающий прямоугольник или на изображение):

  • TRAIN - Какой набор для назначения содержимого в этой строке
  • gs://optik-vcm/... - URI Google Cloud Storage
  • kenarcizgi - Метка, которая определяет, как объект классифицируется
  • Ограничительная рамка для объекта на изображении:
    • x_relative_min, y_relative_min, x_relative_max, y_relative_min, x_relative_max, y_relative_max, x_relative_min, y_relative_max
...