Получить номер страницы текста в PDF - iText - PullRequest
0 голосов
/ 04 октября 2019

Я использую код снизу для получения номера страницы текста, но мой документ PDF содержал много изображений. Я думаю, что главная проблема состоит в том, что эти изображения делают номер страницы не правильным. Кто-нибудь может помочь мне, пожалуйста, мой PDF документ сгенерирован из шаблона HTML, поэтому я не могу получить номер страницы из onChapter метод из PdfPageEventHelper , мне нужно восстановить правильнономер страницы для составления таблицы содержания.

        int index = 0;
        for (String toc : tocValues) {
            for (int i = 1; i <= reader.getNumberOfPages(); i++) {
                if (i < 2 || (index != 0 && i < pageNumbers[index - 1])) continue;

                final String textFromPage = PdfTextExtractor.getTextFromPage(reader, i);

                if (textFromPage.contains(toc)) {
                    System.out.println(String.format("Toc: %s =>>>> %s", toc, i));

                    pageNumbers[index] = i;
                    break;
                }
            }

            index++;
        }
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...