Тессеракт в конкретной c информации - PullRequest
0 голосов
/ 13 апреля 2020

Я хочу отсканировать испанца sh DNI и получить некоторую информацию и распечатать ее на экране. DNI имеет такую ​​форму: 1

И я хочу взять поля DNI, Nombre и Apellidos (на снимке это будет 99999999R, CARMEN, ESPAÑOLA ESPAÑOLA).

Я подумал, что лучше всего использовать «инструмент обрезки» и использовать оптическое распознавание символов в изображениях. Что вы думаете? Я должен сделать проект в HTML / JS, и я действительно не знаю, как это программировать.

Спасибо.

1 Ответ

0 голосов
/ 13 апреля 2020

Это не простая задача, и для ее выполнения необходимо выполнить следующие действия:

  1. Убедитесь, что вы "обрезали" изображение точно по границам. Этот метод должен быть устойчивым к условиям молнии, ситуациям с низкой контрастностью и т. Д. c. В идеале, он должен использовать передовые методы компьютерного зрения и ML

  2. Затем вам нужно определить, где находятся отдельные поля. Это также не простая задача, потому что размеры и позиции полей различаются между разными идентификаторами.

  3. На последнем шаге вам нужно иметь очень надежный инструмент OCR, который даст вам низкий уровень ошибок, так что вы на самом деле получите выгоду от этого автоматически по сравнению с просто перепечатать все эти поля вручную. Несмотря на то, что распознавание текста сегодня кажется простой задачей, оно все еще очень сложно, особенно для документов, удостоверяющих личность, которые могут быть изношены, повреждены и приняты в странных условиях освещения.

Моя компания Microblink потратил годы, работая над сканированием идентификаторов, не только для DNI Spani sh, но и для многих других типов документов (в мире существует более 5000 различных типов).

Если вы заинтересованы читая, как мы это делаем, вот некоторые материалы:

  1. Прощай, шаблоны
  2. BlinkID v5
  3. От OCR до DeepOCR

Что касается «инструмента обрезки» - у нас есть функция, которая позволяет автоматически захватывать изображение документа и обрезать его вокруг края документа. Мы называем это «Захват документа», и это часть нашего BlinkID SDK.

Что касается HTML / JS - не совсем понятно, что именно вам нужно, но у нас есть плагины React Native и Cordova, которые позволяют создавать кроссплатформенные мобильные приложения в JS, а у нас также есть Frontend SDK и веб-API, которые позволяют сканировать документы в любом браузере.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...