Извлеченное изображение PDFBox намного больше, чем исходная страница - PullRequest
0 голосов
/ 09 мая 2020

У меня есть PDF-файл только с изображениями, который выглядит как сканированная копия действительно большой страницы. Предварительный просмотр показывает мне, что это примерно 42x30 дюймов и 3047x2160 пикселей. Думаю, оно было отсканировано с разрешением 72 точки на дюйм.

Inches Pixels

Я извлекаю это изображение с помощью PDFBox, ища экземпляры PDImageXObject, аналогичные { ссылка }.

Однако для этого изображения PDImageXObject.getWidth () и PDImageXObject.getHeight () дают мне 16928 и 12000 соответственно. Когда я вызываю PDImageXObject.getImage (), он создает в памяти огромный BufferedImage.

Есть ли лучший способ извлечь изображение, чтобы оно сохранило исходный размер в пикселях?

...