Как я могу извлечь введенные пользователем поля из PDF? - PullRequest
2 голосов
/ 15 июня 2009

У меня есть сохраняемый файл PDF, в котором есть несколько полей, которые пользователи будут заполнять. Оттуда я хотел бы выполнить пакетную обработку этих файлов, извлекая введенные пользователем поля в файл CVS.

Поскольку я парень .NET, я посмотрел как PDFBox, так и iTextSharp. С PDFBox я смог извлечь текст формы, но не поля, которые пользователь будет вводить в поля. Это не кажется банальным, хотя я могу ошибаться.

Есть ли более быстрый способ выполнить это на любом другом языке? Я слышал о Adobe SDK и буду исследовать это дальше, но пока ничего не знаю об этом. Или кто-то знает, как выполнить то, что я пытаюсь сделать с ранее упомянутыми библиотеками?

ОБНОВЛЕНИЕ: никто не знает ни о каких открытых или бесплатных библиотеках? Я делаю это в большей степени для проверки концепции, и у меня нет нескольких, чтобы решить эту проблему.

Ответы [ 4 ]

1 голос
/ 16 июня 2009

Я настоятельно рекомендую Компоненты высотой Продукты PDF. Я использовал компонент TallPDF.NET для динамического создания PDF-файлов. Высокие компоненты PDFKit.Net, вероятно, сделает все, что вам нужно. Я не использовал этот конкретный продукт от них, но если это что-то похожее на их компонент TallPDF, то это будет отлично. Это довольно дорого, хотя ... где-то около 700 долларов за лицензию. Но у них есть пробная версия, чтобы вы могли их попробовать.

1 голос
/ 15 июня 2009

Попробуйте Apago в PDFspy, http://www.apagoinc.com/pdfspy

0 голосов
/ 15 июня 2009

Когда я смотрел на это (несколько лет назад), вам пришлось использовать Acrobat Professional, а не Acrobat Reader, чтобы заполнять формы, которые впоследствии можно было прочитать. Я никогда не понимал, почему вы не можете сделать это с помощью Acrobat Reader.

0 голосов
/ 15 июня 2009

Хотя я не использовал этот конкретный продукт из ASPOSE, компонент ASPOSE.Pdf.Kit будет извлекать как имена полей, так и данные полей.

Из их литературы :

"Вы также можете прочитать все поля форм документов PDF, включая их имена и значения, в файлы XML, FDF (формат данных форм) и XFDF."

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...