Как наложить информацию ограничивающего прямоугольника на JPG и создать PDF - PullRequest
0 голосов
/ 21 февраля 2019

Контекст: банкомат Googles Tesseract используется для обозначения OCR.Он создает (при правильной конфигурации) PDF-файл, который содержит исходную графику с наложением извлеченного / OCRed-текста.

По разным причинам мы хотим перейти в MS Cognition Services, которая вернет нам что-то вроде этого

{
  "language": "en",
  "textAngle": -2.0000000000000338,
  "orientation": "Up",
  "regions": [
    {
      "boundingBox": "462,379,497,258",
      "lines": [
        {
          "boundingBox": "462,379,497,74",
          "words": [
            {
              "boundingBox": "462,379,41,73",
              "text": "A"
            },
            {
              "boundingBox": "523,379,153,73",
              "text": "GOAL"
            },
            {
              "boundingBox": "694,379,265,74",
              "text": "WITHOUT"
            }
          ]
        },
}

Итак, я получаю извлеченный текст и ограничивающие рамки, но не получаю PDF и оверлей, который мне все еще нужен.

Как создать файл PDF, который принимает графический файли ограничивающая информация?Решение должно работать на .dotnet или nodejs.

...