<lang> .traineddata не найден (даже если он находится в правильной папке) - PullRequest
1 голос
/ 17 марта 2020

Я использую tesseract для обнаружения текста на испанском языке sh на некотором скриншоте игры, у меня были некоторые проблемы с "spa.traineddata", поэтому я начал тренировать свои собственные данные, называемые "spa1.traineddata", и я использовал два файла, чтобы сделать обнаружение текста более точным, вчера я провел несколько тестов и, похоже, работал хорошо, но файл «spa1.traineddata» нуждался в дополнительном обучении, поэтому я решил продолжить сегодня, добавив несколько новых изображений для тренировки своего файла "spa1.trainneddata", а затем я хотел проверить это и выдает мне следующую ошибку

pytesseract.pytesseract.TesseractError: (1, 'Error opening data file C:\\Program Files\\Tesseract-OCR/tessdata/-l spa.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'-l spa\' Error opening data file /home/debian/src/github/tesseract-ocr/tesseract/bin/ndebug/x86_64-w64-mingw32-5.0.0-alpha.20200223/usr/x86_64-w64-mingw32/share/tessdata/spa1 --psm 
6.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'spa1 --psm 6\' Tesseract couldn\'t load any languages! Could not initialize tesseract.') 

, и это строки кода, которые я использую для тестирования

custom_config = r'-l spa+spa1 --psm 6'
pytesseract.image_to_string(Image.open('imagenes/obv.png'), lang=custom_config)

Я был поиска и обнаружил, что ошибка была в том, что файлы lang.traideddata не были в папке tessdata, но мои находятся в папке (поэтому я смог работать с ними вчера)

Я прилагаю скриншот папка tessdata, последние два файла - обученные данные папка tessdata

также полезно использовать vscode, python 3.7 и tesserac t 4

Я надеюсь, что вы можете мне помочь (извините, мой плохой англ sh UWU)

...