Определение, в какой части текста изображения присутствует механизм распознавания - PullRequest
0 голосов
/ 14 марта 2019

В настоящее время я работаю над проектом, связанным с OCR.Мне удалось разработать OCR-движок с использованием tesseract.Теперь, в качестве требования, я могу выяснить, в каких областях текст присутствует внутри файла изображения, чтобы мы могли показывать и изображение, и извлеченный текст бок о бок, это дополнительно увеличило бы шансы уменьшения ошибки, потому что пользователь можетсм. и исправьте выходные данные механизма распознавания.Многие поставщики услуг OCR сделали то же самое, это повысит надежность извлеченного коллектора данных.

1 Ответ

0 голосов
/ 14 марта 2019

Tesseract может выводить файл hOCR .Содержит данные наложения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...