Я пытаюсь преобразовать подобное изображение в текст:
Вывод, полученный из Pytesseract, 1 l_4§ll
Myидеальный вывод будет 1'-4 1/8"
Обратите внимание, что это работает с изображениями текста, в которых дробная часть помещается последовательно, например, если вы обрезали изображение моего идеального вывода, хотя иногда оно портится с кавычками и разбивает егочто-то, с чем я смог работать.
Как заставить Pytesseract работать с этим типом дробного изображения?
Код, который я использую в python для чтения текста изображения:
from PIL import Image
import pytesseract
import cv2
def get_text_from_file(img_path):
#load image
image = cv2.imread(img_path)
text = get_text_from_image(image)
return text
def get_text_from_image(image):
text = pytesseract.image_to_string(image)
return text