Есть ли OCR SDK для C ++ Builder? - PullRequest
1 голос
/ 05 августа 2011

Я бы хотел добавить в приложение функцию распознавания символов, поэтому спрашиваю, какой самый лучший из доступных и доступных OCR SDK. Я посмотрел на ABBY FineReader Engine 10.0, но пока не получил пробную версию, как я просил с официального сайта!

Я скачал Asprise OCR SDK, но он не распознает символы кириллицы ..

Как реализовать распознавание символов в моем приложении? Используя какие библиотеки, SDK, API и т. Д ..

Ответы [ 2 ]

1 голос
/ 24 августа 2011

Я могу порекомендовать вам Crystal OCR, если вам не нужно распознавать очень сложные документы, они прислали мне пример C ++ Builder по запросу.ИМХО, Tesseract все еще глючит, хотя, конечно, это лучший бесплатный OCR.

1 голос
/ 06 августа 2011

Есть Cunieform и Google Tesseract OCR, оба из которых бесплатны.Лично я использовал Tesseract, SDK доставлял много хлопот, поэтому в конце концов решил просто вызвать интерфейс командной строки Tesseract с аргументами из моей программы на C, используя функцию system().

Много людейстолкнуться с трудностями при установке Tesseract, поэтому вот краткое резюме (у меня работает версия 2, при необходимости вставьте соответствующую версию):

  1. Загрузите следующее из svn: tesseract-2.00.tar.gz, tesseract-2.00.exe6.tar.gz, tesseract-2.00.eng.tar.gz

  2. Распаковать tesseract-2.00.tar.gz в папку

  3. Распаковать tesseract-2.00.exe6.tar.gz и переместиться туда, куда tesseract-2.00.tar.gz был распакован,Несколько файлов будут заменены таким образом

  4. Аналогичным образом разархивируйте tesseract-2.00.eng.tar.gz и перейдите в tesseract-2.00.tar.gz, где будет заменена папка tessdata.

    После того, как все это будет сделано,откройте рабочее пространство tesseract.dsw, выберите «Все файлы» и выполните «Перестроить все».Это займет некоторое время с множеством предупреждений, но, надеюсь, без ошибок.

    Команда, использующая оболочку DOS, - tesseract picture.tif textfile -l eng.Поэтому в основном сохраните изображение в виде файла TIFF, выполните команду изнутри вашей программы, а затем прочитайте выходные строки OCR из текстового файла.

...