OCR для считывателя визиток в приложении iPhone - PullRequest
1 голос
/ 09 ноября 2011

Я включил OCR в свое приложение для iPhone, используя библиотеку с открытым исходным кодом «tesseract». Я видел, как некоторые приложения в AppStore делают это. Мне просто интересно, как я могу отделить данные, которые она считывает с карты, то есть, как я буду различать, скажем, FirstName и LastName или между CompanyName и именем человека, как я буду различать, является ли номер Phone # или факсом? # и т. д.

Мне бы хотелось, чтобы были некоторые стандартные форматы визитных карточек, но я чувствую, что было бы нелегко предположить, что так. Любая мысль об этом очень поможет.

Я разместил его здесь, чтобы собраться с мыслями различных разработчиков, чтобы я мог придумать хорошую логику (чтобы сделать ее более точной) для классификации данных, которые мы получаем от механизма OCR.

Ответы [ 2 ]

2 голосов
/ 09 ноября 2011
  • Создайте несколько предположений о том, как можно интерпретировать различные фрагменты текста, и позвольте пользователю выбрать лучший. Формат должен быть довольно стандартным для каждой страны (например, на английском / немецком / французском и т. Д., Имя - 99,9% перед фамилией)
  • Если теперь угадать достаточно, пользователь может назначить поля сам
  • В случае проблемы с именем / фамилией вы можете обратиться к локальному файлу или веб-службе с общими предварительно проанализированными именами в стране пользователя
0 голосов
/ 28 марта 2019

Чтобы различать имя, фамилию, название компании, факс или номер телефона, используйте «Регулярные выражения».

Пример:

Телефон - "^ (\ s * \ d \ s *) {12} $"
Электронная почта - "^ \ w + @ [a-zA-Z _] +?. [A-zA-Z] {2,3} $"

Таким же образом вы можете найти регулярные выражения для других ярлыков в ссылке ниже.

https://www.geeksforgeeks.org/write-regular-expressions/

Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...