Обнаружение текста в документе PDF / TIFF - BoundingBox - PullRequest
0 голосов
/ 25 января 2019

Как создать текст PDF с возможностью поиска по ответу JSON при обнаружении текста документа PDF / TIFF.

Кроме того, как преобразовать вершины BoundingBox в верхнюю, левую, ширину, высоту.

Ответ от JSON ниже:

{
  "boundingBox": {
    "normalizedVertices": [
      {
        "x": 0.14478114,
        "y": 0.046428572
      },
      {
        "x": 0.2777778,
        "y": 0.046428572
      },
      {
        "x": 0.2777778,
        "y": 0.06666667
      },
      {
        "x": 0.14478114,
        "y": 0.06666667
      }
    ]
  },
  "symbols": [
    {
      "property": {
        "detectedLanguages": [
          {
            "languageCode": "en"
          }
        ]
      },
      "text": "R",
      "confidence": 0.99
    },
    {
      "property": {
        "detectedLanguages": [
          {
            "languageCode": "en"
          }
        ]
      },
      "text": "e",
      "confidence": 1
    },
    {
      "property": {
        "detectedLanguages": [
          {
            "languageCode": "en"
          }
        ]
      },
      "text": "l",
      "confidence": 0.99
    },
    {
      "property": {
        "detectedLanguages": [
          {
            "languageCode": "en"
          }
        ]
      },
      "text": "i",
      "confidence": 0.99
    },
    {
      "property": {
        "detectedLanguages": [
          {
            "languageCode": "en"
          }
        ]
      },
      "text": "a",
      "confidence": 0.99
    },
    {
      "property": {
        "detectedLanguages": [
          {
            "languageCode": "en"
          }
        ]
      },
      "text": "n",
      "confidence": 1
    },
    {
      "property": {
        "detectedLanguages": [
          {
            "languageCode": "en"
          }
        ]
      },
      "text": "c",
      "confidence": 1
    },
    {
      "property": {
        "detectedLanguages": [
          {
            "languageCode": "en"
          }
        ],
        "detectedBreak": {
          "type": "EOL_SURE_SPACE"
        }
      },
      "text": "e",
      "confidence": 1
    }
  ],
  "confidence": 0.99
}
...