Question

Я изучаю, как извлечь изображения из большого (> 300 МБ) файла PDF. Я использую pdfbox, но по какой-то конкретной причине, которую я не могу понять, некоторые страницы извлечены неправильно.

Я использую класс PDFToImage pdfbox в качестве основы для моего кода.

Итак, вы знаете другую библиотеку, которая может помочь мне сделать это? Я знаю, что можно использовать iText, но я читал, что его нельзя использовать для коммерческих продуктов.

Я установил пакеты xpdf и xpdf-utils, и утилита pdfimages работает отлично. Но мне нужно решить эту проблему с Java, и она должна быть переносимой.

erjiang · Answer 1 · 30 ноября 2010

Я думаю, что вы говорите о двух разных вещах: извлечение изображений из PDF и преобразование страниц PDF в изображения. PDFToImage будет выводить изображение для каждой страницы, в то время как pdfimages извлекает все внедренные изображения (например, текстовый документ содержит 0 изображений).

Взгляните на org.apache.pdfbox.ExtractImages, чтобы увидеть, делает ли он то, что вы хотите.

Thorbjørn Ravn Andersen · Answer 2 · 30 ноября 2010

Наиболее вероятная причина, по которой трудно работать с 300 МБ PDF, заключается в том, что вам не хватает памяти.Если он работает хорошо для небольших PDF-файлов, я бы поближе посмотрел, почему он не работает.

Как извлечь изображения из PDF с использованием Java (без использования PDF)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как извлечь изображения из PDF с использованием Java (без использования PDF)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов