Я сгенерировал файл коробки из png-изображения, затем я следовал этому руководству: https://pretius.com/how-to-prepare-training-files-for-tesseract-ocr-and-improve-characters-recognition/ для создания файла с обученными данными.
Я столкнулся с ошибкой при попытке использовать генерируемые обученные данные вместе с Pytesseract. и я получил такую ошибку:
raise TesseractError(proc.returncode, get_errors(error_string))
pytesseract.pytesseract.TesseractError: (-4, "read_params_file:
Can't open txt read_params_file: Can't open txt read_params_file: Can't open txt read_params_file: Can't open txt Error: LSTM requested, but not present!! Loading tesseract. mgr->GetComponent(TESSDATA_NORMPROTO, &fp)
:Error:Assert failed:in file adaptmatch.cpp, line 552")
Я использую Tesseract версии 5.0
Это мои параметры конфигурации
traineddata = f'+eng+lav+lav2'
config = f'-l {traineddata} --oem 1 --psm 3 {tessdata_dir}'