Предполагая, что вы можете преобразовать вышеуказанное в JSON, вы можете использовать jsPDF или PDFkit для создания PDF. Функциональность отображается довольно хорошо, основываясь на ограниченных данных, которые вы разместили, но я не видел полной структуры Textract, так как он все еще находится в бета-версии, и я не получил приглашение в программу. Оба этих проекта могут использовать Node для создания серверного решения, но они также работают в браузере.
На момент написания этой статьи в Google Cloud был компонент OCR в функции Vision - Обнаружение текста документа . В отличие от Textract, он подходит к этой задаче, просто сообщая о визуальных элементах документа и создавая всеобъемлющую (и большую) структуру данных, которая описывает то, что он «видит». Согласно Amazon, Textract использует машинное обучение, чтобы упорядочить данные в более понятной для человека форме, которая стремится отличить форму от данных, составляющих заполненную часть формы. Если вы пытаетесь создать относительно полный PDF, продукт Google хорошо подойдет. Textract может быть тоже, но я пока не знаю.