Как построить модель ML с использованием Tesseract? - PullRequest
0 голосов
/ 03 мая 2020

Я недавно начал изучать Тессеракт для извлечения текста из изображений. Теперь следующий код является очень базовым c кодом для этого.

from PIL import Image
import pytesseract
im = Image.open("img.jpg")
text = pytesseract.image_to_string(im)
print(text)

Теперь, если я хочу оптимизировать код так, чтобы он работал для определенного типа изображения (скажем, фотографии удостоверения личности) карты), как я могу сделать модель ML, чтобы сделать это?

Например. если фактический текст на удостоверении личности -

Name Bob
Dept Sales
Joined 2001
Supervisor Martin

И я просто хочу извлечь текст, относящийся к «Имени» и «Регистрация»

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...