PDF - почему нет стандартного элемента структуры для страницы? - PullRequest
0 голосов
/ 25 августа 2011

PDF Spec определяет стандартные типы структуры, используемые для определения дерева структуры для документа.Насколько я вижу, нет элементов, связанных со страницами.Вот стандартные типы структуры для группировки элементов:

Document
Part
Art
Sect
Div
...and so on...

Почему в этом списке нет элемента Page?

Если вы хотите, чтобы ваша структура использовала страницы, что следует использовать?Часть?Секта?Div

Ответы [ 3 ]

1 голос
/ 01 сентября 2011

PDF-теги существуют, чтобы можно было определить тип содержимого / значение элементов.Они должны учитывать своего рода «мета» информацию для PDF, просто предоставляя контекст для содержимого в файле (чтобы содержимое можно было легко извлечь, преобразовать, обработать, сделать доступным и т. Д.).Думайте об этом как содержание к книге.Тот факт, что книга содержит x страниц, не означает, что структура содержимого была бы изменена, если бы высота страницы книги была уменьшена вдвое и теперь содержала 2x страницы.

Объект страницы в структуре документа PDF ужегруппирует элементы (по характеру каждого элемента, находящегося на данной странице), поэтому выполнение этой структуры будет немного излишним.

Также рассмотрим этот случай:

  • Document
    • Содержание (страница 1)
    • Раздел 1 (начинается на странице 2, заканчивается в середине страницы 3)
      1. Подраздел (страница 2)
      2. ПодразделРаздел (половина страницы 3)
    • Раздел 2 (начинается с середины страницы 3)

и т. Д.

В этом примере Раздел 1 и Раздел 2 не могут быть прямыми родителями страницы 3 (не говоря уже о том, что Раздел 1 занимает две разные страницы).Кроме того, попытка решить эту проблему на самом деле не является необходимой, поскольку элементы, сгруппированные здесь, уже являются дочерними по отношению к соответствующему узлу страницы структуры документа в фактическом формате файла.

0 голосов
/ 25 августа 2011

PDF имеет древовидную структуру (что позволяет ему загружать любую страницу так быстро). Содержимое не имеет какой-либо структуры, если только вы не решите использовать отмеченную функцию содержимого в формате, которая затем позволяет метаданным включаться в данные.

0 голосов
/ 25 августа 2011

В приложении G к спецификации PDF приведены примеры, демонстрирующие использование объекта Page.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...