PDFBox возвращает отсутствующий словарь шрифтов потомков - PullRequest
0 голосов
/ 20 февраля 2020

при извлечении первой страницы PDF я получаю java.io.IOException: Missing descendant font dictionary.
Код извлечения следующий:

        PDDocument pdDocument = PDDocument.load(file);
        PageExtractor pageExtractor = new PageExtractor(pdDocument, 1, 1);
        PDDocument singlePageDocument = pageExtractor.extract();

Это происходит только с несколькими PDF-файлами, и ошибка указывает на определения шрифтов , но мне неясно, как шрифты в PDF обрабатываются Apache PDFBox (используется версия v2.0.18).

Любой совет?

Спасибо

...