Я недавно начал изучать Тессеракт для извлечения текста из изображений. Теперь следующий код является очень базовым c кодом для этого.
from PIL import Image
import pytesseract
im = Image.open("img.jpg")
text = pytesseract.image_to_string(im)
print(text)
Теперь, если я хочу оптимизировать код так, чтобы он работал для определенного типа изображения (скажем, фотографии удостоверения личности) карты), как я могу сделать модель ML, чтобы сделать это?
Например. если фактический текст на удостоверении личности -
Name Bob
Dept Sales
Joined 2001
Supervisor Martin
И я просто хочу извлечь текст, относящийся к «Имени» и «Регистрация»