Как обрабатывать PDF документы? - PullRequest
1 голос
/ 11 августа 2010

Мне нужны рекомендации по обработке документов PDF. Эти документы представляют собой годовые отчеты и содержат суммы и цифры в долларах, которые необходимо согласовать.

Я видел некоторые рекомендации по

1) iTextSharp, 
2) PDFBox (IKVM)
3) PDFSharp
4) PDFEdit API (from Adobe)

Какие из них вы бы порекомендовали и есть ли какие-либо ограничения, о которых я должен знать? Помимо открытого исходного кода, я не против платить за коммерческий продукт, если он хорошо поддерживается и полностью функционален.

** Другая информация: ** Все PDF-файлы созданы одним и тем же сторонним поставщиком. Не все PDF-файлы имеют одинаковую структуру - существует около 10 различных структур (шаблонов).

У меня нет требования для записи в PDF.

Большое спасибо заранее.

Ответы [ 3 ]

2 голосов
/ 11 августа 2010

Мой голос будет PDFSharp по следующим причинам ...

  • Проще в использовании, чем ITextSharp (субъективное мнение)
  • Разрешительная лицензия (лицензия X11)
  • Я никогда раньше не слышал о PDFBox; -)
1 голос
/ 12 августа 2010

Проверьте http://www.pdftron.com/. Мы используем его как для чтения, так и для записи PDF-документов - очень надежно.

1 голос
/ 12 августа 2010

Вы также можете посмотреть PDFText .Мы используем это во многих случаях для извлечения необработанных данных из файлов PDF.У него также есть другие недорогие библиотеки, помогающие с другими аспектами работы с PDF.

Это предполагает, что документ не сканируется и содержит данные, которые можно извлечь.

...