Apache PDFBox удаляет горизонтальные линии при конвертации в PNG - PullRequest
0 голосов
/ 12 февраля 2019

У меня есть PDF, который при рендеринге в png удаляет горизонтальные и вертикальные линии.Это PDF и как оно должно выглядеть: https://drive.google.com/file/d/1sAXwnaoZ-QJn1Kbpw85hhzV_X5zwgfkA/view?usp=sharing

А вот PNG PDF с использованием PDFBox 2.0.13: enter image description here

Почемуудалены эти строки и как я могу получить их в PNG?

1 Ответ

0 голосов
/ 12 февраля 2019

Проблема (скорее всего) заключается в том, что у вас не установлен плагин Java ImageIO для формата изображений JBIG2, поскольку отсутствующие строки и заголовки на самом деле являются изображениями JBIG2.

Когда я запускаю PDFBox PDF Debugger без такогоплагин и откройте свой PDF в нем, он также не отображает недостающие части;добавив такой плагин в свой путь к классам, он неожиданно отображает их.

Для получения более подробной информации о зависимостях PDFBox, пожалуйста, прочитайте Страница PDFBox 2.0 Зависимости .В частности,

JAI Image I / O

PDF поддерживает встроенные файлы изображений, однако для поддержки некоторых форматов требуются сторонние библиотеки, которые распространяются на условиях, несовместимых с лицензией Apache 2.0:

Эти библиотеки являются необязательными и будут загружаться, если они присутствуют в пути к классам, в противном случае поддержка этих форматов изображений будет отключена ипредупреждение будет зарегистрировано при обнаружении неподдерживаемого изображения.

Зависимости Maven для этих компонентов можно найти в parent / pom.xml.При необходимости измените область действия компонентов.Убедитесь, что любые сторонние лицензии подходят для вашего проекта.

Чтобы включить библиотеку JBIG2, в ваш проект pom.xml может быть включена следующая часть:

<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>jbig2-imageio</artifactId>
    <version>3.0.0</version>
</dependency>
...