Python Tesseract: аргумент int () должен быть строкой, байтовоподобным объектом или числом, а не 'tuple` - PullRequest
0 голосов
/ 04 февраля 2019

Я новичок в машинном обучении, и я хотел попробовать код извлечения текста.Вот мой код:

import pytesseract from PIL import Image 
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract OCR.exe" 
img = Image.open('image.png') 
img.load()
imgString = pytesseract.image_to_string(img)

Однако это приводит к этой ошибке:

TypeError: int() argument must be a string, a bytes-like object or a number, not 'tuple`'

Я использую Jupyter Notebook (python 3) для запуска этой программы.Могу ли я что-нибудь сделать или есть более простой способ извлечь текст из изображения?

Ответы [ 2 ]

0 голосов
/ 06 февраля 2019

Имя исполняемого файла неверно, используйте приведенный ниже код, вы получите ответ

pytesseract.pytesseract.tesseract_cmd = "C:/Program Files (x86)/Tesseract-OCR/tesseract.exe"

Другие строки кода - файл.Спасибо

0 голосов
/ 04 февраля 2019

Метод Image.load ()

Выделяет хранилище для изображения и загружает данные пикселей.В обычных случаях вам не нужно вызывать этот метод, поскольку класс Image автоматически загружает открытое изображение при первом обращении к нему.

img.load()

до

#img.load()
...