Распознавание результатов Azure Form Recognizer boundingBox преобразуется в XY-координацию - PullRequest
0 голосов
/ 19 мая 2019

Я хочу преобразовать результат распознавателя форм "boundingBox" в координаты изображения для визуализации наложенного изображения и распознанных данных. Однако результат boundingBox выглядит не как координата XY, как на этом изображении. https://i.stack.imgur.com/DOEi5.png

Мне нужно правило вычисления левого верхнего (X1, Y1) и правого нижнего (X2, Y2) каждого boundingBox.

Я также сделал некоторые правила вычисления с помощью Cognitive Service OCR и распознавания текста, но не информации о Form Recognizer. Я пытался найти правило координат XY по минусу или делению, но не по правилам, которые я получил.

Это результат JSON-данных, которые я получил на образце формы Recognizer. Но не удалось найти из него правило boundingBox.

Responsebody: {
  'status': 'success',
  'pages': [
    {
      'number': 1,
      'height': 792,
      'width': 612,
      'clusterId': 0,
      'keyValuePairs': [
        {
          'key': [
            {
              'text': 'Address:',
              'boundingBox': [
                57.3,
                683.0,
                100.5,
                683.0,
                100.5,
                673.7,
                57.3,
                673.7
              ]
            }
          ],
          'value': [
            {
              'text': '1020 Enterpirse Way.',
              'boundingBox': [
                57.3,
                672.2,
                153.1,
                672.2,
                153.1,
                658.8,
                57.3,
                658.8
              ],
              'confidence': 0.53
            },

Мне нужно правило вычисления левого верхнего (X1, Y1) и правого нижнего (X2, Y2) каждого boundingBox.

Спасибо команде.

1 Ответ

0 голосов
/ 21 мая 2019

8 чисел представляют 4 пары (x, y) координат углов ограничительной рамки в следующем порядке: верхний левый, верхний правый, нижний правый, нижний левый. Начало системы координат находится внизу слева на странице. Для ключа 'Адрес:' в вашем примере у вас есть верхний левый (X1, Y1) = (57,3, 683,0) и нижний правый (X2, Y2) = (100,5, 673,7).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...