Вопрос первый:
что такое формат изображения и аннотации для классификации изображений / распознавания объектов
Это основано на этом вопросе , на который не было получено ни одного ответа.
Что я заметил, так это то, что разные наборы данных используют разные форматы аннотаций. Например, COCO использует json и imagNet csv. Кроме того, некоторые используют сглаженные изображения в коде RGB, а другие - как аннотации. Если используется код RGB, RGB хранится по-другому ... и т. Д.
Это все очень запутанно.
Может кто-нибудь дать мне обзор основных и наиболее распространенных подходов? Как сортировать и комментировать изображения, а затем, как соединить изображение / boundingbox / annotation?
Заранее спасибо
Приветствия
edit: справка будет учебным пособием от А до Я. То есть, принимая ваши собственные изображения, комментируйте их, упорядочивайте их, загружайте их с помощью Keras / тензорного потока, используйте простой CNN для классификации или распознавания объектов.
Было бы интересно провести параллельную классификацию / обнаружение объектов, так как они похожи, но различны во всей установке.