Сценарий
Пользователь откроет камеру (из моего приложения для Android), наведет ее на свой идентификатор, и модель определит, является ли это тип идентификатора, который мы ищем.
Что я пробовал
Я пробовал сравнивать изображения, как гистограмму, но это не просто так, а SSIM (структурное сходство), но оно не соответствует моему сценарию. SSIM работает, если изображение имеет одинаковый размер пикселя / матрицы. (из того, что я пробовал и наблюдал лол). Я использую openCV для этого.
Обнаружение объекта кажется излишним (или нет?), Потому что я хочу, чтобы моя модель распознала четкое изображение.
Что я пытаюсь сделать
Я пытаюсь создать классификацию изображений по одному классу, в которой моя модель должна идентифицировать определенный тип идентификатора (например, паспорт).
После того, как я искал одну классификацию классов (OCC), появляются предложения, подобные автоэнкодеру на основе cnn. Но, похоже, не хватает ресурсов или учебников для создания простого.
Итак, я думаю иметь как минимум 10 четких изображений различных деталей одного и того же идентификатора, и это будет мой CLEAR_ID_CLASS .
Затем я увеличу те же 10 четких изображений (наклон, поворот, уменьшение, увеличение и т. Д.), И я отмечу это как NOT_CLEAR_ID_CLASS .
Вопрос
10 изображений - это всего лишь небольшой набор данных для нейронных сетей, я точно не знаю, что произойдет с моей моделью, если она перегрузится. Мой вопрос будет ли это работать? Я смотрю в правильном направлении, чтобы достичь своей цели? Или есть способ достичь моей цели?
Я спрашиваю, потому что это может занять некоторое время (обучение модели), и я не хочу тратить время просто на то, чтобы узнать, что это не сработает.