Это первый раз, когда я работаю с OCR.У меня есть изображение и я хочу извлечь данные из изображения.Мое изображение выглядит так:
У меня есть 500 таких изображений, и мне нужно будет записать параметры и соответствующие значения.Я думаю сделать это с помощью кода, а не делать это вручную.
Я пробовал использовать Python py-tesseract и библиотеки PIL.Они работают хорошо, если изображение содержит простой текст. Это то, что я пытался
from PIL import Image, ImageEnhance, ImageFilter
from pytesseract import image_to_string
from pytesseract import image_to_boxes
im = Image.open("AHU.png")
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
im.save('temp2.jpg')
text = image_to_string(Image.open('temp2.jpg'))
print(text)
Что делать в этом случае, когда есть несколько параметров?Все мои изображения похожи в отношении положения значений.