Проблема библиотеки Tesseract: невозможно прочитать параметры модели языка куба - PullRequest
0 голосов
/ 18 июня 2020

При запуске скрипта выдает ошибку

  File "/home/y700/Env/electron/lib/python3.7/site-packages/pytesseract/pytesseract.py", line 246, in run_tesseract
    raise TesseractError(proc.returncode, get_errors(error_string))
pytesseract.pytesseract.TesseractError: (-11, 'Cube ERROR (CubeRecoContext::Load): unable to read cube language model params from /usr/local/share/tessdata/eng.cube.lm Cube ERROR (CubeRecoContext::Create): unable to init CubeRecoContext object init_cube_objects(false, &tessdata_manager):Error:Assert failed:in file tessedit.cpp, line 210')

Насколько я понимаю, отсутствует какой-то файл eng.cube.lm.
Структура файла по пути /usr/local/share/tessdata/

configs  
eng.traineddata  
pdf.ttf  
tessconfigs

И, может быть, это важно при выводе версии установленного пакета командой dpkg --list Я получаю

tesseract-ocr  4.1.1

но используя tesseract --version получаю

tesseract 3.05.02
 leptonica-1.74.1
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.2) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0

Установленная библиотека используя это руководство https://tesseract-ocr.github.io/tessdoc/Home.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...