PDF-теги существуют, чтобы можно было определить тип содержимого / значение элементов.Они должны учитывать своего рода «мета» информацию для PDF, просто предоставляя контекст для содержимого в файле (чтобы содержимое можно было легко извлечь, преобразовать, обработать, сделать доступным и т. Д.).Думайте об этом как содержание к книге.Тот факт, что книга содержит x страниц, не означает, что структура содержимого была бы изменена, если бы высота страницы книги была уменьшена вдвое и теперь содержала 2x страницы.
Объект страницы в структуре документа PDF ужегруппирует элементы (по характеру каждого элемента, находящегося на данной странице), поэтому выполнение этой структуры будет немного излишним.
Также рассмотрим этот случай:
- Document
- Содержание (страница 1)
- Раздел 1 (начинается на странице 2, заканчивается в середине страницы 3)
- Подраздел (страница 2)
- ПодразделРаздел (половина страницы 3)
- Раздел 2 (начинается с середины страницы 3)
и т. Д.
В этом примере Раздел 1 и Раздел 2 не могут быть прямыми родителями страницы 3 (не говоря уже о том, что Раздел 1 занимает две разные страницы).Кроме того, попытка решить эту проблему на самом деле не является необходимой, поскольку элементы, сгруппированные здесь, уже являются дочерними по отношению к соответствующему узлу страницы структуры документа в фактическом формате файла.