Экспорт PDF-страниц в серию изображений в Java - PullRequest
9 голосов
/ 15 февраля 2009

Мне нужно экспортировать страницы произвольного PDF-документа в серию отдельных изображений в формате jpeg / png / etc. Мне нужно сделать это в Java.

Хотя я знаю о iText, PDFBox и различных других библиотеках java pdf, я надеюсь на указатель на какой-нибудь рабочий пример или несколько практических рекомендаций.

Спасибо.

Ответы [ 6 ]

18 голосов
/ 15 февраля 2009

Вот один из способов сделать это, объединяя некоторые фрагменты кода со всего Интернета.

Как нарисовать PDF в изображение?

https://pdf -renderer.dev.java.net / examples.html

Создание буферизованного изображения из изображения

ОРИГИНАЛ: http://www.exampledepot.com/egs/java.awt.image/Image2Buf.html

ОБНОВЛЕНО: Как преобразовать буферизованное изображение в изображение и наоборот?

Сохранение сгенерированной графики в файл PNG или JPEG

ОРИГИНАЛ: http://www.exampledepot.com/egs/javax.imageio/Graphic2File.html

ОБНОВЛЕНО: http://docs.oracle.com/javase/tutorial/2d/images/saveimage.html

Объединены во что-то, что работает так, чтобы превратить все страницы в изображения:

import com.sun.pdfview.PDFFile;
import com.sun.pdfview.PDFPage;

import java.awt.Graphics;
import java.awt.GraphicsConfiguration;
import java.awt.GraphicsDevice;
import java.awt.GraphicsEnvironment;
import java.awt.HeadlessException;
import java.awt.Image;
import java.awt.Rectangle;
import java.awt.Transparency;
import java.io.*;
import java.nio.ByteBuffer;
import java.nio.channels.FileChannel;
import javax.swing.*;
import javax.imageio.*;
import java.awt.image.*;

public class ImageMain {
    public static void setup() throws IOException {
        // load a pdf from a byte buffer
        File file = new File("test.pdf");
        RandomAccessFile raf = new RandomAccessFile(file, "r");
        FileChannel channel = raf.getChannel();
        ByteBuffer buf = channel.map(FileChannel.MapMode.READ_ONLY, 0, channel.size());
        PDFFile pdffile = new PDFFile(buf);
        int numPgs = pdffile.getNumPages();
        for (int i = 0; i < numPgs; i++) {
            // draw the first page to an image
            PDFPage page = pdffile.getPage(i);
            // get the width and height for the doc at the default zoom
            Rectangle rect = new Rectangle(0, 0, (int) page.getBBox().getWidth(), (int) page.getBBox().getHeight());
            // generate the image
            Image img = page.getImage(rect.width, rect.height, // width & height
                    rect, // clip rect
                    null, // null for the ImageObserver
                    true, // fill background with white
                    true // block until drawing is done
                    );
            // save it as a file
            BufferedImage bImg = toBufferedImage(img);
            File yourImageFile = new File("page_" + i + ".png");
            ImageIO.write(bImg, "png", yourImageFile);
        }
    }

    // This method returns a buffered image with the contents of an image
    public static BufferedImage toBufferedImage(Image image) {
        if (image instanceof BufferedImage) {
            return (BufferedImage) image;
        }
        // This code ensures that all the pixels in the image are loaded
        image = new ImageIcon(image).getImage();
        // Determine if the image has transparent pixels; for this method's
        // implementation, see e661 Determining If an Image Has Transparent
        // Pixels
        boolean hasAlpha = hasAlpha(image);
        // Create a buffered image with a format that's compatible with the
        // screen
        BufferedImage bimage = null;
        GraphicsEnvironment ge = GraphicsEnvironment.getLocalGraphicsEnvironment();
        try {
            // Determine the type of transparency of the new buffered image
            int transparency = Transparency.OPAQUE;
            if (hasAlpha) {
                transparency = Transparency.BITMASK;
            }
            // Create the buffered image
            GraphicsDevice gs = ge.getDefaultScreenDevice();
            GraphicsConfiguration gc = gs.getDefaultConfiguration();
            bimage = gc.createCompatibleImage(image.getWidth(null), image.getHeight(null), transparency);
        } catch (HeadlessException e) {
            // The system does not have a screen
        }
        if (bimage == null) {
            // Create a buffered image using the default color model
            int type = BufferedImage.TYPE_INT_RGB;
            if (hasAlpha) {
                type = BufferedImage.TYPE_INT_ARGB;
            }
            bimage = new BufferedImage(image.getWidth(null), image.getHeight(null), type);
        }
        // Copy image to buffered image
        Graphics g = bimage.createGraphics();
        // Paint the image onto the buffered image
        g.drawImage(image, 0, 0, null);
        g.dispose();
        return bimage;
    }

    public static boolean hasAlpha(Image image) {
        // If buffered image, the color model is readily available
        if (image instanceof BufferedImage) {
            BufferedImage bimage = (BufferedImage) image;
            return bimage.getColorModel().hasAlpha();
        }
        // Use a pixel grabber to retrieve the image's color model;
        // grabbing a single pixel is usually sufficient
        PixelGrabber pg = new PixelGrabber(image, 0, 0, 1, 1, false);
        try {
            pg.grabPixels();
        } catch (InterruptedException e) {
        }
        // Get the image's color model
        ColorModel cm = pg.getColorModel();
        return cm.hasAlpha();
    }

    public static void main(final String[] args) {
        SwingUtilities.invokeLater(new Runnable() {
            public void run() {
                try {
                    ImageMain.setup();
                } catch (IOException ex) {
                    ex.printStackTrace();
                }
            }
        });
    }
}
4 голосов
/ 19 февраля 2009

Если вы рассматриваете библиотеку JPedal PDF, она встроена и задокументирована с примером источника https://support.idrsolutions.com/hc/en-us/articles/115001978091-Convert-PDF-Files-to-Image

1 голос
/ 17 мая 2012

Если вы обнаружите, что Sun Renderer не работает для всех ваших документов PDF, вы можете использовать jPDFImages.

Чтобы быть более эффективными, вы должны конвертировать каждую страницу PDF в буферизованное изображение и оттуда конвертировать в различные форматы изображений, которые вам нужны. Это позволит избежать необходимости конвертировать PDF в изображения для каждого формата.

Вот ссылка для преобразования из PDF в буферизованные изображения с использованием jPDFImages: http://kbdeveloper.qoppa.com/jpdfimages/codesampleconvertpdfpageintobufferedimageinjava

Для каждого изображения страницы вы можете просто экспортировать в различные форматы изображения: ImageIO.write (pageBufferedImage, "JPEG", outputFile); ImageIO.write (pageBufferedImage, "PNG", outputFile); и т.д ...

0 голосов
/ 24 октября 2018

PDF в растровое изображение (код, совместимый с Android)

File pdfFile = new File(filePath);
PdfRenderer renderer = new PdfRenderer(ParcelFileDescriptor.open(pdfFile, ParcelFileDescriptor.MODE_READ_ONLY));

final int pageCount = renderer.getPageCount();
//Currently for a page, iterate for all the pages
PdfRenderer.Page page = renderer.openPage(pageCount);
int width =  page.getWidth();
int height = page.getHeight();

Bitmap bitmap = Bitmap.createBitmap(width, height, Bitmap.Config.ARGB_8888);

Растровое изображение в PNG (или любой другой формат)

0 голосов
/ 08 ноября 2012

Для этого есть разные библиотеки. Я достиг этого с PDFBox . Но, на мой взгляд, наиболее эффективным решением является использование ghostscript . Но если вы думаете, что вам нужно простое решение, используйте ImageMagick . Но ImageMagick внутренне вызывает ghostscript. Использование ghostscript или imagemagick даст вам лучшее решение. Это намного быстрее, чем любые другие библиотеки.

0 голосов
/ 27 сентября 2010

Просто начните цикл for с 1 вместо 0. Ваша проблема будет решена.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...