Я пытаюсь прочитать текст из файлов изображений TIF или TIFF.Эти файлы имеют несколько страниц.
Когда я печатаю массив, я получаю только значение true, а затем нет текста.Однако, когда я использую файлы .png, я могу напечатать текст.
Ниже приведен мой код.
from PIL import Image, ImageSequence
import pytesseract
from pytesseract import image_to_string
import numpy as np
import cv2
test = Image.open(r'C:\Python\BG36820V1.tiff')
#test1 = Image.open(r'C:\Users\Documents\declaration.png')
testarray = np.array(test)
print(testarray)
print(pytesseract.image_to_string(Image.fromarray(testarray))
Это выход для тестового файла:
[[ True True True ... True True True]
[ True True True ... True True True]
[ True True True ... True True True]
...
[ True True True ... True True True]
[ True True True ... True True True]
[ True True True ... True True True]]
Однако это хорошо работает с test1.
[[[242 242 242 255]
[242 242 242 255]
[242 242 242 255]
...
[242 242 242 255]
[242 242 242 255]
[242 242 242 255]]
[[182 180 182 255]
[182 180 182 255]
[182 180 182 255]
...
[182 180 182 255]
[182 180 182 255]
[182 180 182 255]]
g Request 4042337300021 submitted sucessfully
x
TYPE
Я попытался OpenCV для чтения файлов TIFF, я получаю формат не поддерживается.
Как мне распечатать текст изTIFF или TIFF файлы.
Есть предложения?
С уважением, Ren.