Question

У меня есть многостраничный файл .tif, и мне нужно извлечь из него текст.Я пытаюсь применить Gaussian blur, чтобы улучшить его качество, а затем применить Tesseract OCR, чтобы извлечь текст.Я получаю ошибку ниже при применении размытия по Гауссу

Ошибка типа: тип данных src = 0 не поддерживается

Код

from PIL import Image, ImageSequence
from tesserocr import PyTessBaseAPI
import numpy as np
import pycountry
import cv2

with PyTessBaseAPI() as api:
    img = Image.open('sample.tif')

    for i, page in enumerate(ImageSequence.Iterator(img)):
        page2 = np.asarray(page)

        # Gaussian Blur
        imgG = cv2.GaussianBlur(page2, (5,5), 0)  # <---- ERROR

        # Tesseract OCR
        api.SetImage(imgG)
        text = api.GetUTF8Text()

Err0r при использовании 0pen CV Gaussian Blur

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Err0r при использовании 0pen CV Gaussian Blur

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы