При попытке установить и использовать tesseract на windows 10 с python с помощью pytesseract я получаю сообщение об ошибке:
File "C:\ProgramData\Anaconda3\lib\site-packages\pytesseract\pytesseract.py", line 194, in run_tesseract
raise TesseractError(status_code, get_errors(error_string))
TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\eng.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'eng\' Tesseract couldn\'t load any languages! Could not initialize tesseract.')
Я попытался переустановить tesseract.Я установил C: \ Program Files (x86) \ Tesseract-OCR в переменные окружения PATH. Я добавил TESSDATA_PREFIX в C: \ Program Files (x86) \ Tesseract-OCR \ tessdata. Я проверял, что, когда я набираю 'tesseract'в CMD работает
Код, который я использую:
import cv2
import pytesseract
# Uncomment the line below to provide path to tesseract manually
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe"
# Define config parameters.
# '-l eng' for using the English language
# '--oem 1' for using LSTM OCR Engine
config = ('-l eng --oem 1 --psm 3')
# Read image from disk
im = cv2.imread("Serie1/NL83LHL9.JPG", cv2.IMREAD_COLOR)
# Run tesseract OCR on image
text = pytesseract.image_to_string(im, config=config)
# Print recognized text
print(text)
Результаты:
CMD> tesseract: показывает интерфейс tesseract