Алгоритм машинного обучения, который дает несколько выходов, сопоставленных с одного входа - PullRequest
0 голосов
/ 10 октября 2018

Мне нужна помощь, я работаю над проблемой, когда у меня есть OCR изображения счета и я хочу извлечь из него определенные данные, такие как номер счета, сумма, дата и т. Д., Которые все присутствуют в OCR.Я пытался с моделью классификации, где я индивидуально передавал каждое предложение от OCR к модели и предсказывал это номер счета или дату или что-нибудь еще, но этот подход занимает много времени, и я не думаю, что это правильноподход.

Итак, я подумал, есть ли алгоритм, где я могу иметь входную строку и иметь выходные данные, сопоставленные с этой строкой, как, например, номер счета, дата и сумма присутствуют в строке.

Например:

Inp string: The invoice 1234 is due on 12 oct 2018 with amount of 287 
Output: Invoice Number: 1234, Date: 12 oct 2018, Amount 287

Итак, мой вопрос: есть ли алгоритм, который я могу обучить нескольким счетам и затем делать прогнозы?

1 Ответ

0 голосов
/ 10 октября 2018

По сути, вы ищете NER (распознавание именованных объектов).Существует несколько бесплатных и платных инструментов для отображения намерений и сущностей.Вы можете использовать Google DialogFlow, MS LUIS или RASA с открытым исходным кодом для идентификации объекта в данном тексте.если вы хотите разработать собственное решение, то вы можете посмотреть и на OpenNLP.Пожалуйста, вернитесь к своим наблюдениям по этим вопросам к вашей проблеме

...