Маркировка распознавателя формы - модель Traning - PullRequest
1 голос
/ 13 января 2020

Я пытаюсь использовать Azure Form Recognizer с инструментом Labeling для обучения и извлечения текста из изображений. Согласно документации:

Сначала убедитесь, что все учебные документы имеют одинаковый формат. Если у вас есть формы в нескольких форматах, организуйте их в подпапки на основе общего формата. Когда вы тренируетесь, вам нужно направить API в подпапку. (https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/label-tool#set -up-input-data )

В моем случае у меня есть разные отформатированные изображения. Я могу создавать различные проекты, маркировать изображения, обучать их и получать ожидаемый результат. В моем случае проблема заключается в том, что, если я буду следовать этому подходу, мне нужно создавать различные проекты, обучать его отдельно и поддерживать несколько идентификаторов моделей.

Поэтому я просто хотел знать, есть ли способ, где мы можем обучать различные форматы вместе как единая тренировочная модель? По сути, я хочу знать, можем ли мы использовать один идентификатор модели для извлечения пары ключ-значение из различных отформатированных изображений?

Ответы [ 2 ]

1 голос
/ 14 января 2020

Эта функция была запрошена несколькими клиентами. Мы работаем над решением этой проблемы, ожидая, что оно появится через несколько месяцев. На данный момент мы предлагаем вам обучать модели отдельно и поддерживать несколько идентификаторов моделей.

0 голосов
/ 14 января 2020

Если это только несколько разных типов (например, 2-4), и они легко различимы, вы также можете попробовать обучить их всех вместе. Однако, чтобы это работало, вам нужно будет пометить больше файлов, и результаты все равно, вероятно, не будут такими же хорошими, как у отдельных моделей. введите все в одну папку и добавьте метку.

Если существует много разных типов, это вряд ли сработает.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...