Может ли PyTesseract преобразовывать изображения, содержащие фрагменты, в текст? - PullRequest
0 голосов
/ 27 сентября 2018

Я пытаюсь преобразовать подобное изображение в текст:

1'-4 1/8

Вывод, полученный из Pytesseract, 1 l_4§ll
Myидеальный вывод будет 1'-4 1/8"

Обратите внимание, что это работает с изображениями текста, в которых дробная часть помещается последовательно, например, если вы обрезали изображение моего идеального вывода, хотя иногда оно портится с кавычками и разбивает егочто-то, с чем я смог работать.

Как заставить Pytesseract работать с этим типом дробного изображения?

Код, который я использую в python для чтения текста изображения:

from PIL import Image
import pytesseract
import cv2

def get_text_from_file(img_path):
    #load image
    image = cv2.imread(img_path)
    text = get_text_from_image(image)
    return text

def get_text_from_image(image):
    text = pytesseract.image_to_string(image)
    return text
...