извлекать текст из изображений программно - PullRequest
1 голос
/ 21 марта 2011

Я ищу программный способ получения текста на изображениях. Я не знаю ни одного такого инструмента, если он уже доступен. Мне нужно сначала скачать изображения, а затем извлечь из них текст. Есть ли программный способ сделать это?

Ответы [ 2 ]

2 голосов
/ 20 мая 2011

OCR - это сложная технология (сегментация изображения, коррекция угла, бинаризация, сегментация символов, анализ комбинированных и разбитых символов, проверка словаря и т. Д.), Но есть готовые к использованию механизмы OCR, большинство из которых являются коммерческими, например:

  • Самый точный (и дорогой + роялти) - движок Abby OCR.
  • Хорошая точность (роялти) - OCR-движок OmniPage.
  • Хорошая точность (без роялти) - движок Nicomsoft CrystalOCR.
  • Приемлемая точность (бесплатно) - двигатель Tesseract OCR.
2 голосов
/ 21 марта 2011

Тессеракт OCR может извлекать текст из изображений.Что именно вы подразумеваете под извлечением ?

...