разделение PDF на разные страницы PDF - PullRequest
0 голосов
/ 13 апреля 2011

Я пытаюсь использовать следующую библиотеку импорта com.itextpdf для |: из одного документа PDF создайте новый документ PDF на странице.

Например, для файла a.pdf, который составляет 3 страницы, я создаю файлы a1.pdf a2.pdf и a3.pdf, которые a1 являются первой страницей файла etc и т.д.

По некоторым причинам созданный вывод неверен. Если a.pdf - это одна страница, новая страница, созданная в виде другого хэша ... приветствуется любая помощь

public static void onePage(int num, String to, PdfReader reader) throws DocumentException,IOException {
    Document document = new Document(PageSize.A4);

    PdfWriter writer = PdfWriter.getInstance(document,new FileOutputStream(to));
    document.open();

    PdfImportedPage page;
    page = writer.getImportedPage(reader, num);
    Image instance = Image.getInstance(page);

    instance.setAbsolutePosition(0, 30);

    document.add(instance);

    document.close();

}
public static void makePages(String name) throws IOException, DocumentException{

    PdfReader reader = new PdfReader(name+".pdf");
    int n = reader.getNumberOfPages();
    for(int i=1; i<=n;i++){
        onePage(i,  name+i+".pdf", reader);
    }
}

Ответы [ 3 ]

1 голос
/ 13 апреля 2011

Хэш двух PDF-файлов, скорее всего, отличается только потому, что PDF-документы содержат много дополнительных метаданных, которые, вероятно, не копируются идентично при копировании одной страницы в новый PDF-файл.Это может быть столь же незначительным, как информация о том, с чем и когда был создан PDF.Проще всего было бы просто вообще не разбивать PDF, если есть только одна страница.

1 голос
/ 23 января 2014

Преобразование страниц PDF в отдельные страницы с помощью PDFBox.

Скачать PDFBox jar с Apache PDFBox последние выпуски ,

поддерживаемых jar для выполнения нижеприведенной Java-программы pdfbox-1.8.3.jar и commons-logging-1.1.3.jar

import java.io.File;
import java.util.List;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
/**
 * 
 * @author udaykiran.pulipati
 *
 */

@SuppressWarnings("unchecked")
public class ExtractPagesFromPdfAndSaveAsNewPDFPage {
    public static void main(String[] args) {
        try {
            String sourceDir = "C:/PDFCopy/04-Request-Headers.pdf";
            String destinationDir = "C:/PDFCopy/";
            File oldFile = new File(sourceDir);
            String fileName = oldFile.getName().replace(".pdf", "");
            if (oldFile.exists()) {
                File newFile = new File(destinationDir);
                if (!newFile.exists()) {
                    newFile.mkdir();
            }

            PDDocument document = PDDocument.load(sourceDir);
            List<PDPage> list = document.getDocumentCatalog().getAllPages();

            int pageNumber = 1;
            for (PDPage page : list) {
                PDDocument newDocument = new PDDocument();
                newDocument.addPage(page);

                newFile = new File(destinationDir + fileName + "_"+ pageNumber +".pdf");
                newFile.createNewFile();

                newDocument.save(newFile);
                newDocument.close();
                pageNumber++;
            }
        } else {
            System.err.println(fileName +" File not exists");
        }
    } catch (Exception e) {
        e.printStackTrace();
    }
}

}

0 голосов
/ 13 апреля 2011

вы можете проверить, нет ли страниц, и если есть только одна страница, вам не нужно создавать новый PDF. это? это было бы простым решением проблемы

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...