Я использую pytesseract для извлечения текста из изображения.
from PIL import Image
from pytesseract import image_to_string, image_to_boxes, image_to_data
img = Image.open('device.png')
print(image_to_boxes(img))
print(image_to_data(img))
print(image_to_string(img))
Это мое изображение, и я хочу извлечь данные из изображения.
Я начал с вышеприведенного кода, и вывод из первых двух операторов вывода:
~ 0 0 0 0 0
level page_num block_num par_num line_num word_num left top width height conf text
1 1 0 0 0 0 0 0 1027 742 -1
2 1 1 0 0 0 0 0 0 742 -1
3 1 1 1 0 0 0 0 0 742 -1
4 1 1 1 1 0 0 0 0 742 -1
5 1 1 1 1 1 0 0 0 742 95
Третий оператор печати не дает вывода или, скорее, нулевой вывод.
Я запутался, если я где-то не так? Это правильный способ использовать OCR для извлечения текста из изображения