Как мне заняться маркировкой / классификацией изображений? - PullRequest
1 голос
/ 08 мая 2019

Допустим, у меня есть набор изображений паспортов.Я работаю над проектом, в котором мне нужно идентифицировать имя в каждом паспорте и в конечном итоге преобразовать этот объект в текст.

Для самой первой части маркировки (или классификации (я думаю, здесь новичок)), гдеимя указано в каждом паспорте, как мне поступить об этом?

Какие методы / программное обеспечение я могу использовать для достижения этой цели?

в деталях или любые ссылки были бы хорошими.Я пытаюсь выяснить, как это сделать именно так, чтобы я мог начать кодирование

Я знаю, что обучение модели возможно, но я просто не уверен

Я использую Python, еслиэто имеет значение.

спасибо

1 Ответ

0 голосов
/ 08 мая 2019

Существует два маршрута, по которым вы можете пометить данные (или вы хотите пометить данные как свои), а другой, где их нет.

Давайте начнем с последнего. Скажем, у вас есть изображение паспорта. Вы хотите определить, где находится текст на изображении и что говорит этот текст. Вы можете достичь этого, используя библиотеку под названием pytessaract. Это ИИ, который делает именно это для вас. Он работает хорошо, потому что он был обучен на многих других изображениях, поэтому он хорош для обнаружения текста в любом изображении.

Если у вас есть ярлыки, вы могли бы улучшить свою модель, которую могли бы сделать с помощью pytessaract, но это намного сложнее. Если вы все равно хотите изучить его, я бы рекомендовал с обучением ŧensorflow и использовать «трансферное обучение» для улучшения вашей модели.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...