Я изучаю, как извлечь изображения из большого (> 300 МБ) файла PDF. Я использую pdfbox, но по какой-то конкретной причине, которую я не могу понять, некоторые страницы извлечены неправильно.
Я использую класс PDFToImage pdfbox в качестве основы для моего кода.
Итак, вы знаете другую библиотеку, которая может помочь мне сделать это? Я знаю, что можно использовать iText, но я читал, что его нельзя использовать для коммерческих продуктов.
Я установил пакеты xpdf и xpdf-utils, и утилита pdfimages работает отлично. Но мне нужно решить эту проблему с Java, и она должна быть переносимой.