Какой самый простой способ объединить (на стороне сервера) коллекцию документов PDF в один большой документ PDF в JAVA - PullRequest
4 голосов
/ 18 сентября 2008

У меня есть 3 документа PDF, которые создаются на лету устаревшей библиотекой, которую мы используем, и записываются на диск. Какой самый простой способ для кода моего сервера JAVA взять эти 3 документа и превратить их в один длинный PDF-документ, в котором есть только все страницы из документа № 1, за которыми следуют все страницы из документа № 2 и т. Д.

В идеале я хотел бы, чтобы это происходило в памяти, чтобы я мог вернуть его в виде потока клиенту, но также можно записать его на диск.

Ответы [ 6 ]

4 голосов
/ 18 сентября 2008

@ J D OConal, спасибо за подсказку, статья, которую вы прислали мне, была очень устаревшей, но она действительно указала мне на iText. Я нашел эту страницу, которая объясняет, как сделать именно то, что мне нужно: http://java -x.blogspot.com / 2006/11 / слияния-PDF-файлы-с-itext.html

Спасибо за другие ответы, но я действительно не хочу, чтобы я порождал другие процессы, если я могу избежать этого, и у нашего проекта уже есть itext.jar, поэтому я не добавляю никаких внешних зависимостей

Вот код, который я написал в итоге:

public class PdfMergeHelper {

    /**
     * Merges the passed in PDFs, in the order that they are listed in the java.util.List.
     * Writes the resulting PDF out to the OutputStream provided.
     * 
     * Sample Usage:
     * List<InputStream> pdfs = new ArrayList<InputStream>();
     * pdfs.add(new FileInputStream("/location/of/pdf/OQS_FRSv1.5.pdf"));
     * pdfs.add(new FileInputStream("/location/of/pdf/PPFP-Contract_Genericv0.5.pdf"));
     * pdfs.add(new FileInputStream("/location/of/pdf/PPFP-Quotev0.6.pdf"));
     * FileOutputStream output = new FileOutputStream("/location/to/write/to/merge.pdf");
     * PdfMergeHelper.concatPDFs(pdfs, output, true);
     * 
     * @param streamOfPDFFiles the list of files to merge, in the order that they should be merged
     * @param outputStream the output stream to write the merged PDF to
     * @param paginate true if you want page numbers to appear at the bottom of each page, false otherwise
     */
    public static void concatPDFs(List<InputStream> streamOfPDFFiles, OutputStream outputStream, boolean paginate) {
        Document document = new Document();
        try {
            List<InputStream> pdfs = streamOfPDFFiles;
            List<PdfReader> readers = new ArrayList<PdfReader>();
            int totalPages = 0;
            Iterator<InputStream> iteratorPDFs = pdfs.iterator();

            // Create Readers for the pdfs.
            while (iteratorPDFs.hasNext()) {
                InputStream pdf = iteratorPDFs.next();
                PdfReader pdfReader = new PdfReader(pdf);
                readers.add(pdfReader);
                totalPages += pdfReader.getNumberOfPages();
            }
            // Create a writer for the outputstream
            PdfWriter writer = PdfWriter.getInstance(document, outputStream);

            document.open();
            BaseFont bf = BaseFont.createFont(BaseFont.HELVETICA, BaseFont.CP1252, BaseFont.NOT_EMBEDDED);
            PdfContentByte cb = writer.getDirectContent(); // Holds the PDF
            // data

            PdfImportedPage page;
            int currentPageNumber = 0;
            int pageOfCurrentReaderPDF = 0;
            Iterator<PdfReader> iteratorPDFReader = readers.iterator();

            // Loop through the PDF files and add to the output.
            while (iteratorPDFReader.hasNext()) {
                PdfReader pdfReader = iteratorPDFReader.next();

                // Create a new page in the target for each source page.
                while (pageOfCurrentReaderPDF < pdfReader.getNumberOfPages()) {
                    document.newPage();
                    pageOfCurrentReaderPDF++;
                    currentPageNumber++;
                    page = writer.getImportedPage(pdfReader, pageOfCurrentReaderPDF);
                    cb.addTemplate(page, 0, 0);

                    // Code for pagination.
                    if (paginate) {
                        cb.beginText();
                        cb.setFontAndSize(bf, 9);
                        cb.showTextAligned(PdfContentByte.ALIGN_CENTER, "" + currentPageNumber + " of " + totalPages,
                                520, 5, 0);
                        cb.endText();
                    }
                }
                pageOfCurrentReaderPDF = 0;
            }
            outputStream.flush();
            document.close();
            outputStream.close();
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            if (document.isOpen()) {
                document.close();
            }
            try {
                if (outputStream != null) {
                    outputStream.close();
                }
            } catch (IOException ioe) {
                ioe.printStackTrace();
            }
        }
    }
}
2 голосов
/ 22 мая 2012

iText, похоже, изменился и теперь имеет требования к коммерческому лицензированию, а также не очень хорошую помощь (Хотите документацию? Купите нашу книгу!).

В итоге мы нашли PDFSharp http://www.pdfsharp.net/ и использовали его. Пример объединения нескольких документов в формате PDF прост и легок для понимания: http://www.pdfsharp.net/wiki/ConcatenateDocuments-sample.ashx

Наслаждайтесь Случайная

2 голосов
/ 18 сентября 2008

Я использовал pdftk для отличного эффекта. Это внешнее приложение, которое вам нужно будет запустить из вашего Java-приложения.

1 голос
/ 18 сентября 2008
1 голос
/ 18 сентября 2008

Взгляните на этот список Java-библиотек PDF с открытым исходным кодом .

Также ознакомьтесь с этой статьей .

[Редактировать: всегда есть Ghostscript, который прост в использовании, но кому нужны дополнительные зависимости?]

0 голосов
/ 20 августа 2012

PDFBox - безусловно, самый простой способ достичь этого, в коде есть утилита PDFMerger, которая делает вещи очень простыми, все, что мне потребовалось, это цикл for и 2 строки кода в ней и все сделано :) 1003 *

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...