Я использую код снизу для получения номера страницы текста, но мой документ PDF содержал много изображений. Я думаю, что главная проблема состоит в том, что эти изображения делают номер страницы не правильным. Кто-нибудь может помочь мне, пожалуйста, мой PDF документ сгенерирован из шаблона HTML, поэтому я не могу получить номер страницы из onChapter метод из PdfPageEventHelper , мне нужно восстановить правильнономер страницы для составления таблицы содержания.
int index = 0;
for (String toc : tocValues) {
for (int i = 1; i <= reader.getNumberOfPages(); i++) {
if (i < 2 || (index != 0 && i < pageNumbers[index - 1])) continue;
final String textFromPage = PdfTextExtractor.getTextFromPage(reader, i);
if (textFromPage.contains(toc)) {
System.out.println(String.format("Toc: %s =>>>> %s", toc, i));
pageNumbers[index] = i;
break;
}
}
index++;
}