Я использую api распознавателя форм в резолюциях Генеральной Ассамблеи ООН.Документы представлены в очень специфическом формате, но не в традиционном формате, который нравится API.У них нет имен полей в документе, но там определенно есть поля.Используя REST API (через Python), я могу получить значения, извлеченные как часть ключа « Tokens ».
Мои вопросы: Могу ли я обучить модель назначать определенные ключиэти компоненты формы?
Например, в этом примере https://undocs.org/en/A/RES/70/204, некоторые пары ключ-значение, которые я хотел бы получить в качестве результата:
- Разрешение: A /RES / 70/204
- Орган: Генеральная Ассамблея
- Дата: 23 февраля 2016 года
- Сессия: семидесятая сессия
- Повестка дня: пункт 20 (c) повестки дня
- Название ID: 70/204
- Название: Международная стратегия уменьшения опасности бедствий
- Комитет: [по докладу Второго комитета (A / 70/472 / Add.3)]
Я всегда мог написать некоторый код синтаксического анализа, чтобы посмотреть на положение, заданное ограничивающими прямоугольниками, и назначить ключи на основе этого, но мне было интересно, есть ли в API функция, которую яЯ не в курсе.