Есть ли OCR, который можно обучить новым символам? - PullRequest
2 голосов
/ 31 мая 2011

Имеется ли какой-либо бесплатный OCR с открытым исходным кодом, который можно обучить новым символам, а также вывести координаты символа, найденные на целевом изображении?Я читал, что тессеракт OCR можно обучить, но может ли он дать мне координаты после OCR?любой пример?Мне нужен код / ​​шаги для обучения ocr, используя изображение, которое содержит один символ.В каждом изображении есть около 20 символов для обучения.а затем используйте обученное распознавание текста, чтобы обнаружить эти символы на целевом изображении и, если оно найдено, указать также координаты.

1 Ответ

4 голосов
/ 05 июня 2011

Вы можете обучить Тессеракт распознавать новые символы.Формат hocr содержит координаты распознанных слов.

https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract

http://vietocr.sourceforge.net/training.html

https://github.com/tesseract-ocr/tesseract/wiki/Command-Line-Usage#hocr-output

...