Я пытаюсь использовать функцию run_tesseract, чтобы получить вывод hocr для извлечения текста из изображения для изображений банковских чеков. Однако я получаю вышеуказанное сообщение об ошибке.Я установил Tesseract-OCR на своем ноутбуке и также добавил его путь к моей переменной System Path. У меня 64-битная операционная система Windows 10,
Я также пытался удалить и переустановить ее, но безрезультатно.
import glob
import pytesseract
from PIL import Image
img_files=glob.glob('./NACH/*.jpg')
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract OCR\\tesseract.exe'
#im=Image.open(img_files[0])
#im.load()
pytesseract.run_tesseract(img_files[0],'output',lang='eng',config='hocr')
Я получаю следующее полное сообщение об ошибке:
AttributeError Traceback (последний последний вызов) в
4 im = Image.open (img_files [0])
5 im.load ()
----> 6 pytesseract.run_tesseract (img_files [0], 'output', lang = 'eng', config = 'hocr')
7 #text = pytesseract.image_to_string (im)
8 #if os.path.isfile ('output.html'): AttributeError: модуль 'pytesseract' не имеет атрибута 'run_tesseract'