Можно ли обучить модели обнаружения объектов выполнять классификацию изображений?
Вот так я представляю go. Допустим, мы хотим классифицировать изображения кошек и собак. Допустим, все изображения имеют размер 256х256. Аннотация для изображений кошек будет выглядеть следующим образом:
{image_id: ?, object: 'cat', bounding_box: [0, 0, 255, 255]} ...
Для изображений собак идея та же: {image_id: ?, object: 'dog', bounding_box: [0, 0, 255, 255]} ...
То есть ограничивающие рамки установить как целое изображение. Мне любопытно, будет ли это работать. Если да, то как его производительность будет сравниваться с моделями классификации изображений?