Azure Таблица распознавателя форм не извлекается должным образом - PullRequest
0 голосов
/ 09 июля 2020

Я использую https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/curl-train-extract для создания модели обучения без использования меток.

Проблема, с которой я сталкиваюсь, заключается в том, что я запускаю файл через модель (файл был использован для обучения модели), это не «столовая» часть. Я имею в виду, что здесь нет узла "таблицы".

Из того, что я видел, он должен иметь возможность построить его как часть JSON, но разбивая его на супер-гранулярное OCR, например,

{
                    "key": {
                        "text": "__Tokens__34",
                        "boundingBox": null,
                        "elements": null
                    },
                    "value": {
                        "text": "2 X 3/4",
                        "boundingBox": [
                            3.1181,
                            3.7292,
                            3.5278,
                            3.7292,
                            3.5278,
                            3.8583,
                            3.1181,
                            3.8583
                        ],
                        "elements": null
                    },
                    "confidence": 1.0
                }

Мне не хватает флага или чего-то такого?

Заранее спасибо.

Ответы [ 2 ]

0 голосов
/ 15 июля 2020

У меня была такая же проблема, но я заметил, что она работает, когда я включаю Full Text

0 голосов
/ 09 июля 2020

Похоже, что таблица не определяется автоматически с Train без меток, не могли бы вы поделиться изображением таблицы, пожалуйста, удалите всю информацию PII. Вы также можете попробовать Train with label или Layout API, чтобы узнать, распознает ли он таблицу автоматически.

...