Использование Tesseract 4 в Windows - PullRequest
0 голосов
/ 08 октября 2018

Я изо всех сил, чтобы использовать Tesseract OCR в Windows.Вот что я установил: tesseract-ocr-w32-setup-v4.0.0-rc1.20181002.exe отсюда:

https://github.com/UB-Mannheim/tesseract/wiki

enter image description here

и я установил на мою машину.После этого я настроил переменную среды

enter image description here

, но когда я пытаюсь получить текст из изображения, с помощью этой команды:

C:\Users\flaviu.marc>tesseract c:\Flaviu\imagine.png C:\Flaviu\output.txt

Я получаю следующие ошибки:

Error opening data file C:\Program Files (x86)\Tesseract-OCR\eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.

Можете ли вы помочь мне решить мою проблему?Я пытаюсь использовать tesseract в приложении VC ++, но получаю точно такие же ошибки, как и при использовании tesseract из командной строки.

После обновления переменной среды:

enter image description here

Я получаю следующую ошибку:

C:\Users\flaviu.marc>tesseract c:\Flaviu\imagine.png C:\Flaviu\output.txt
Tesseract Open Source OCR Engine vv4.0.0-rc1.20181002 with Leptonica
Error in pixReadStreamPng: spp == 1, cmap, trans array, invalid depth: 4

Позднее редактирование: если я попробовал другое изображение, инициализация работает сейчас, но у меня все еще есть некоторые сообщения об ошибках:

Error in pixReadMemTiff: function not present
Error in pixReadMem: tiff: no pix returned
Error in pixaGenerateFontFromString: pix not made
Error in bmfCreate: font pixa not made

Почему я сталкиваюсь с этими ошибками?Потому что, когда я пытаюсь запустить классический код (pImage NULL)

Pix* pImage = pixRead(sFileName);
if(NULL == pImage)
{
    m_sError.Format(_T("Could not read image with leptonica."));
    return sRet;
}

Код берется отсюда: https://github.com/tesseract-ocr/tesseract/wiki/APIExample

Вот как я скомпилировал leptonica: enter image description here

как можно скомпилировать libtiff?У меня нет выбора для этого ...

1 Ответ

0 голосов
/ 08 октября 2018

TESSDATA_PREFIX должен указывать на каталог с файлами обученных данных, например:

по умолчанию tessdata

хорошее качество tessdata, но медленно

tessdata быстрое, но низкое качество

...