tesseract-ocr читает текст с картинки с символьной цепочкой - PullRequest
0 голосов
/ 03 ноября 2018

Мне нужно прочитать текст, используя Тессеракт OCR , и мне нужно узнать положение символов на изображении, есть какой-то способ решить эту задачу, пожалуйста, помогите мне

1 Ответ

0 голосов
/ 09 января 2019

Я получил ответ, я использую Tesseract с hocr

hOCR - это открытый стандарт представления данных для форматированного текста, полученного с помощью оптического распознавания символов. Определение кодирует текст, стиль, информацию о разметке, метрики достоверности распознавания и другую информацию с использованием расширяемого языка разметки в форме языка разметки гипертекста или XHTML

.

Синтаксис командной строки, такой как

tesseract someimage.jpg hocr 
...