Изменить
Поскольку ответы на дополнительные услуги стали доступны, хотя некоторые из них я лично не пробовал, они могут подойти для этой цели.
https://docs.microsoft.com/en-us/azure/search/cognitive-search-concept-intro
И в какой-то момент в будущем, когда идет ГА.https://aws.amazon.com/textract/
Оригинальный ответ
К сожалению, в Azure нет интеграции с PDF для API Computer Vision.Чтобы использовать Azure Computer Vision, вам нужно изменить PDF-файл на изображение (JPG, PNG, BMP, GIF) самостоятельно.
Google do теперь предлагает интеграцию pdf, и я пока вижу некоторые действительно хорошие результаты от этого тестирования.
Это делается с помощью метода asyncBatchAnnotateFiles методаКлиент видения (я использовал вариант API NodeJS)
Он может обрабатывать файлы до 2000 страниц, результаты разбиваются на 20 страниц и выводятся в Google Cloud Storage.
https://cloud.google.com/vision/docs/pdf