AttributeError: модуль 'pytesseract' не имеет атрибута 'run_tesseract' - PullRequest
0 голосов
/ 24 мая 2019

Я пытаюсь использовать функцию run_tesseract, чтобы получить вывод hocr для извлечения текста из изображения для изображений банковских чеков. Однако я получаю вышеуказанное сообщение об ошибке.Я установил Tesseract-OCR на своем ноутбуке и также добавил его путь к моей переменной System Path. У меня 64-битная операционная система Windows 10,

Я также пытался удалить и переустановить ее, но безрезультатно.

import glob
import pytesseract
from PIL import Image
img_files=glob.glob('./NACH/*.jpg')
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract OCR\\tesseract.exe'
#im=Image.open(img_files[0])
#im.load()
pytesseract.run_tesseract(img_files[0],'output',lang='eng',config='hocr')

Я получаю следующее полное сообщение об ошибке:

AttributeError Traceback (последний последний вызов) в

4 im = Image.open (img_files [0])

5 im.load ()

----> 6 pytesseract.run_tesseract (img_files [0], 'output', lang = 'eng', config = 'hocr')

7 #text = pytesseract.image_to_string (im)

8 #if os.path.isfile ('output.html'): AttributeError: модуль 'pytesseract' не имеет атрибута 'run_tesseract'

...