Я пытаюсь сделать OCR с Python.Я нашел этот код в интернете, который сделал то, что я хочу.Но когда я пытаюсь запустить его, я получаю это сообщение об ошибке.
Оставьте свой код здесь:
import io
from PIL import Image
import pytesseract
from wand.image import Image as wi
pdf = wi(filename="test1(citibank).pdf", resolution=300)
pdfImage = pdf.convert('jpeg')
imageBlobs = []
for img in pdfImage.sequence:
imgPage=wi(image=img)
imageBlobs.append(imgPage.make_blob('jpeg'))
recognisedtext = []
for imgBlob in imageBlobs:
im = Image.open(io.BytesIO(imgBlob))
text = pytesseract.image_to_string(im, lang='es')
recognisedtext.append(text)
print(recognisedtext[1])