Страница PDF написана в нижнем колонтитуле - PullRequest
1 голос
/ 09 марта 2012

Кто-нибудь знает, как читатель acrobat знает страницу, которую я сейчас просматриваю? Например - у меня есть файл PDF, который содержит номера страниц в нижнем колонтитуле в формате - 1 / A или 1/1 - разделенные на главы, и acrobat знает, что это номер страницы - он не записывает только общее количество страниц от начала до эта текущая страница.

Я пишу приложения на C #, WinForms, где мне нужно получить номер страницы - так же, как это делает acrobat. Я преобразую каждую страницу в текст с помощью pdfLibView lib, но затем мне нужно просмотреть последнюю страницу и использовать сложные алгоритмы, чтобы выяснить, какая строка в нижнем колонтитуле является номером страницы - она ​​может содержать любую другую информацию.

Итак, есть идеи, как получить номер страницы в формате, как написано на этой странице?

1 Ответ

1 голос
/ 09 марта 2012

Кажется, что ваш документ использует функцию надписей страниц, определенную в спецификации PDF.

8.3.1. Этикетки страницы гласят:

Кроме того, документ может опционально определять ярлыки страниц (PDF 1.3) для идентифицировать каждую страницу визуально на экране или в печати. Ярлыки страниц и индексы страниц не обязательно должны совпадать: индексы фиксированы, работают последовательно через документ, начиная с 0 для первой страницы, но метки могут быть указаны любым способом, который подходит для конкретный документ. Например, если документ начинается с 12 страниц переднего вопроса пронумерованы римскими цифрами, а остальная часть документ нумеруется на арабском языке, первая страница будет иметь индекс страницы 0 и метка страницы i, двенадцатая страница будет иметь индекс 11 и метка xii, а тринадцатая страница будет иметь индекс 12 и метку 1.

Вы можете попробовать Библиотека Docotic.Pdf , если хотите получить доступ к информации о метках страницы в существующем документе (отказ от ответственности: я работаю на поставщика библиотеки).

Вот пример того, как добавить метки страницы в документ PDF . Этот пример не показывает, как получить доступ к существующим ярлыкам, но может дать некоторые подсказки для начала.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...