Question

Я недавно начал изучать Тессеракт для извлечения текста из изображений. Теперь следующий код является очень базовым c кодом для этого.

from PIL import Image
import pytesseract
im = Image.open("img.jpg")
text = pytesseract.image_to_string(im)
print(text)

Теперь, если я хочу оптимизировать код так, чтобы он работал для определенного типа изображения (скажем, фотографии удостоверения личности) карты), как я могу сделать модель ML, чтобы сделать это?

Например. если фактический текст на удостоверении личности -

Name Bob
Dept Sales
Joined 2001
Supervisor Martin

И я просто хочу извлечь текст, относящийся к «Имени» и «Регистрация»

Как построить модель ML с использованием Tesseract?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как построить модель ML с использованием Tesseract?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы