извлекать текст из изображения, используя pytesseract python - PullRequest
0 голосов
/ 11 июня 2019

Это первый раз, когда я работаю с OCR.У меня есть изображение и я хочу извлечь данные из изображения.Мое изображение выглядит так:

enter image description here

У меня есть 500 таких изображений, и мне нужно будет записать параметры и соответствующие значения.Я думаю сделать это с помощью кода, а не делать это вручную.

Я пробовал использовать Python py-tesseract и библиотеки PIL.Они работают хорошо, если изображение содержит простой текст. Это то, что я пытался


from PIL import Image, ImageEnhance, ImageFilter

from pytesseract import image_to_string

from pytesseract import image_to_boxes

im = Image.open("AHU.png")
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
im.save('temp2.jpg')
text = image_to_string(Image.open('temp2.jpg'))
print(text)

Что делать в этом случае, когда есть несколько параметров?Все мои изображения похожи в отношении положения значений.

...