Синтаксис PDF лучше всего понять, рассматривая его как четыре части, как показано на рисунке 1:
• Объекты. Документ PDF - это структура данных, состоящая из небольшого набора базовых типов объектов данных.
Подпункт 7.2 «Лексические соглашения» описывает набор символов, используемый для написания объектов и других
синтаксические элементы. Подпункт 7.3 «Объекты» описывает синтаксис и основные свойства объектов.
Подпункт 7.3.8, «Объекты потока», содержит полную информацию о наиболее сложном типе данных - потоке.
объект.
• Файловая структура. Структура файла PDF определяет, как объекты хранятся в файле PDF, как они
Доступ и как они обновляются. Эта структура не зависит от семантики объектов. под-
раздел 7.5 «Структура файла» описывает структуру файла. Подпункт 7.6 «Шифрование» описывает уровень файлов
механизм защиты содержимого документа от несанкционированного доступа.
• Структура документа. Структура документа PDF определяет, как основные типы объектов используются для
представляют компоненты документа PDF: страницы, шрифты, аннотации и т. д. Подпункт 7.7,
«Структура документа» описывает общую структуру документа; более поздние пункты обращаются к подробным
семантика компонентов.
• Потоки контента. Поток содержимого PDF содержит последовательность инструкций, описывающих внешний вид
страница или другой графический объект. Эти инструкции, хотя и представлены в виде объектов, концептуально
отличается от объектов, которые представляют структуру документа и описываются отдельно. Подпункт
7.8, «Потоки контента и ресурсы», рассматриваются потоки контента PDF и связанные с ними ресурсы.
Похоже, что навигация по PDF-файлу потребует чуть больше времени.