Я разработал модуль OCR, который извлекает содержимое отсканированного документа и сохраняет его в сопоставлениях эластичного поиска. Теперь я пытаюсь улучшить распознавание текста, сказав ему классифицировать документы по типам (диплом, сертификаты, удостоверение личности), по каждому типу. будет храниться в определенном индексе. Каков лучший алгоритм машинного обучения, который может выполнить работу?