У меня есть многостраничный файл .tif
, и мне нужно извлечь из него текст.Я пытаюсь применить Gaussian blur
, чтобы улучшить его качество, а затем применить Tesseract OCR
, чтобы извлечь текст.Я получаю ошибку ниже при применении размытия по Гауссу
Ошибка типа: тип данных src = 0 не поддерживается
Код
from PIL import Image, ImageSequence
from tesserocr import PyTessBaseAPI
import numpy as np
import pycountry
import cv2
with PyTessBaseAPI() as api:
img = Image.open('sample.tif')
for i, page in enumerate(ImageSequence.Iterator(img)):
page2 = np.asarray(page)
# Gaussian Blur
imgG = cv2.GaussianBlur(page2, (5,5), 0) # <---- ERROR
# Tesseract OCR
api.SetImage(imgG)
text = api.GetUTF8Text()