PDFBOX: конвертировать PDF в текст или HTML, включая изображения из PDF - PullRequest
0 голосов
/ 12 марта 2012

Я занимаюсь разработкой мобильного приложения, которое конвертирует pdf в html. Я нашел PDFBox, который работает очень хорошо. Я получил текст PDF или HTML на одной стороне, а другие изображения. Но я хочу пойти немного дальше, мне нужен сгенерированный HTML содержит изображения в формате PDF. Можно ли это сделать с помощью PDFBox? Как? Если вам известна другая функция бесплатной библиотеки для этого, скажите мне.

Заранее спасибо.

1 Ответ

1 голос
/ 13 марта 2012

Взгляните на ExtractImages.java - это поможет вам узнать, как извлечь изображения из файла PDF.

Далее рассмотрим пример PrintImageLocations.java -эти места вам понадобятся для правильного форматирования файла HTML.

...