OCR - это сложная технология (сегментация изображения, коррекция угла, бинаризация, сегментация символов, анализ комбинированных и разбитых символов, проверка словаря и т. Д.), Но есть готовые к использованию механизмы OCR, большинство из которых являются коммерческими, например:
- Самый точный (и дорогой + роялти) - движок Abby OCR.
- Хорошая точность (роялти) - OCR-движок OmniPage.
- Хорошая точность (без роялти) - движок Nicomsoft CrystalOCR.
- Приемлемая точность (бесплатно) - двигатель Tesseract OCR.