Контекст: банкомат Googles Tesseract используется для обозначения OCR.Он создает (при правильной конфигурации) PDF-файл, который содержит исходную графику с наложением извлеченного / OCRed-текста.
По разным причинам мы хотим перейти в MS Cognition Services, которая вернет нам что-то вроде этого
{
"language": "en",
"textAngle": -2.0000000000000338,
"orientation": "Up",
"regions": [
{
"boundingBox": "462,379,497,258",
"lines": [
{
"boundingBox": "462,379,497,74",
"words": [
{
"boundingBox": "462,379,41,73",
"text": "A"
},
{
"boundingBox": "523,379,153,73",
"text": "GOAL"
},
{
"boundingBox": "694,379,265,74",
"text": "WITHOUT"
}
]
},
}
Итак, я получаю извлеченный текст и ограничивающие рамки, но не получаю PDF и оверлей, который мне все еще нужен.
Как создать файл PDF, который принимает графический файли ограничивающая информация?Решение должно работать на .dotnet или nodejs.