Я использую Apache PDFBox для чтения документа PDF, иерархия которого определяется закладками. Иерархия представлена в виде дерева с содержимым только на уровне листьев.
Извлечение текста между двумя листовыми закладками с использованием следующего кода:
Stripper.setStartBookmark(),
Stripper.setEndBookmark(),
Stripper.writeText()),
Вместо этого возвращает текст на всей странице. Короче говоря, моя проблема похожа на упомянутую в этой теме .
Есть ли способ извлечь содержимое между двумя закладками?
Если так, что должно измениться в моем коде?