Преобразование PDF в несколько JPG с помощью iText или другого - PullRequest
0 голосов
/ 21 июня 2011

Мне нужно преобразовать любой многостраничный PDF-файл в набор JPG.

Поскольку PDF-файлы предполагаются от сканера, мы можем предположить, что каждая страница содержит толькографический объект для извлечения, но я не могу быть на 100% уверен в этом.

Итак, мне нужно преобразовать любой визуализируемый контент с каждой страницы в один файл JPEG.

Как я могу это сделатьэто с iText?

Если я не могу сделать это с iText, какая библиотека Java может достичь этого?

Спасибо.

Ответы [ 4 ]

2 голосов
/ 21 июня 2011

Ghostscript (доступен для Windows, Linux, MacOS X, Solaris, AIX, ...) может конвертировать ...

  • ... из форматов ввода: PDF, PostScript, EPS и AI
  • ... в выходные форматы: JPEG, TIFF, PNG, PNM, PPM, BMP (и более).

(Упомянутый выше ImageMagick не выполняет преобразование самостоятельно - он использует Ghostscript под капотом, как и многие другие инструменты.)

1 голос
/ 08 декабря 2011

С Apache PDFBox вы можете делать следующее:

PDDocument document = PDDocument.load(pdffile);
List<PDPage> pages = document.getDocumentCatalog().getAllPages();
for (int i = 0; i < pages.size(); i++) {
  PDPage page = pages.get(i);
  BufferedImage image = page.convertToImage(BufferedImage.TYPE_INT_RGB, 72);
  ImageIO.write(image, "jpg", new File(pdffile.getAbsolutePath() + "_" + i + ".jpg"));
}
1 голос
/ 21 июня 2011

Вы также можете использовать PDF-рендерер Sun, а JPedal делает PDF для изображения (низкое и высокое разрешение.

1 голос
/ 21 июня 2011

ICEpdf - http://www.icepdf.org/ - имеет версию с открытым исходным кодом, которая должна делать то, что вам нужно.

Я считаю, что основное отличие между версией с открытым исходным кодом и платной версией заключается в том, чтоУ pay-for гораздо лучшая поддержка шрифтов.

...