Заполняемое преобразование PDF в XML в MarkLogic - PullRequest
1 голос
/ 06 марта 2019

Я загрузил некоторые файлы PDF в MarkLogic с помощью MLCP, которые затем были преобразованы в XML с помощью преобразования PDF по умолчанию CPF.Некоторые из PDF-файлов можно было заполнить, но ни один из заполненных материалов не был включен в конверсию.Есть ли способ преобразовать это?

1 Ответ

0 голосов
/ 07 марта 2019

Являются ли эти формы PDF, которые были заполнены пользователем?Если так, некоторые конвертеры не передают данные формы PDF.PDFTables могут работать - API позволяет конвертировать ваши PDF-файлы в XML, включая любые данные формы.

В качестве примера в Python (может использоваться любой язык):

import pdftables_api

c = pdftables_api.Client('my-api-key')

c.xml('input.pdf', 'output.xml')
...