Amazon Textract - Как определить мои пары ключ-значение - PullRequest
0 голосов
/ 11 февраля 2020

Я пробовал textract, и я вижу, что он извлекает несколько интересных пар ключ-значение.

У меня есть набор данных изображения, каждый из которых аннотирован набором доменных-специфических c пар ключ-значение, которые отличается от того, что textract нашел.

Есть ли способ заставить текстракт искать мои пары ключ-значение? Вид трансферного обучения, или конкретная c конфигурация инструмента?

1 Ответ

0 голосов
/ 12 февраля 2020

Нет. Нет никакого способа изменить то, как textract предсказывает текст или определяет отношения между ними. Вы можете продолжать добавлять изображения и формы, и textract будет (теоретически) обучаться им, но я сомневаюсь, что это сильно поможет. Вы можете попытаться получить необработанный текст, который обнаружен, и придумать свой собственный сценарий, чтобы связать их. Обратите внимание, что textract вернет обнаруженный необработанный текст в том порядке, в котором он найдет их в изображении / pdf Так что довольно легко придумать свои собственные логики c, чтобы отобразить их так, как вы хотите.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...