Windows 7 OCR API - PullRequest
       44

Windows 7 OCR API

15 голосов
/ 23 мая 2011

Я просматривал замены для Office 2007 MODI OCR (решение OneNote 2010 года имеет меньшее качество / результаты, чем в 2007 году :-(). Я заметил, что Windows 7 содержит библиотеку OCR после установки дополнительного фильтра TIFF

Компонент OCR устанавливается на

%programfiles%\Common Files\microsoft shared\OCR\7.0\xocr3.psp.dll 

, но я не вижу API для него?

Кто-нибудь видит, как это можно связать предпочтительно вC #?

ОТВЕТ: Найден раствор, как только установлена ​​дополнительная функция win7 для tiff ifilter, я могу получить текстовый вывод скриншота, используя код / ​​exe на http://www.codeproject.com/KB/cs/IFilter.aspx. Также, если добавить то же самое[HKEY_CLASSES_ROOT.tiff \ PersistentHandler] для .png и .jpg, тогда OCR также работает для jpg и png.

Ответы [ 3 ]

4 голосов
/ 13 июня 2011
  1. Tessnet OCR - хорошее решение, но довольно старое (последний выпуск от 2009 года). Для .NET доступно несколько очень хороших бесплатных решений для распознавания текста:
  2. Asprise C # OCR SDK . Очень хороший и быстрый.
  3. Исследовательский проект Microsoft на Гавайях Сетевое (облачное) решение для оптического распознавания текста с полными документами и образцами (прекращено в 2013 году)
  4. Bing OCR Замена OCR на основе веб-интерфейса (в облаке) для указанных выше. (прекращено в марте 2014 года)
2 голосов
/ 02 июня 2011

Попробуйте TessNet, используя предложения, которые я сделал для автора в этом посте (увеличить изображение, используйте отдельный процесс):
c # OCR не может распознавать цифры (тессеракт 2)

1 голос
/ 05 августа 2012

Я изучал Windows 7 DLL и нашел 3 библиотеки, которые могут быть полезны: thocr.psp.dll, xocr3.psp.dll и ximage3b.dll. На этом веб-сайте и других подобных веб-сайтах я обнаружил, что ximage3b - это системный ocr-движок Windows. Я искал документацию онлайн, но я не добился успеха, но эй! по крайней мере, я знаю, что это там, я дам вам, ребята, обновление, если я узнаю, как использовать его с C # / C / C ++.

...