Ограничения дерева имен PDF - PullRequest
       15

Ограничения дерева имен PDF

1 голос
/ 02 февраля 2012

У меня есть файл PDF, который я пытаюсь проанализировать с помощью PDF Renderer , и у меня возникают следующие проблемы:

(1) Некоторые деревья имен имеют Пределы определяется с нижней или верхней границей NULL.В спецификации ничего не говорится о том, как с этим справиться:

(Intermediate and leaf nodes only; required) An array of two strings, specifying
the (lexically) least and greatest keys included in the Names array of a leaf 
node or in the Names arrays of any leaf nodes that are descendants of an
intermediate node. 

Так что я в основном предполагаю открытый диапазон, если любая из границ равна нулю, если оба предела равны нулю, я попробуюнайти ключ в именах.Это предположение верно?

(2) В том же файле PDF, когда делается предположение из (1), хотя ключ, который я ищу, будет вписываться в диапазон, определяемый пределами, ключ не присутствует, но должен искатьна следующих детей.Я думаю, это все еще правильно?

(3) Наконец, и все еще в том же файле PDF, есть Имена , которые не следуют за

key1 value1 key2 value2 ... keyn valuen

последовательность определена в спецификации, но начинается со значения:

value0 key1 value1 ... keyn valuen

и заканчивается значением.Поэтому в этом случае я просто пропускаю первое значение, рискуя ошибиться в отображении.Опять же, правильно?

Я предполагаю, что:

  • либо файл PDF плохо сформирован
  • либо он использует некоторые функциональные возможности 1.6, которые полностью запутывают библиотеку и приводитк перечисленным выше симптомам

Я хотел бы внести изменения в библиотеку для обработки рассматриваемого PDF-файла, не нарушая существующий код.

Обновление : чтобы исправить эту проблему, я, наконец, решил не заниматься всем вышеперечисленным, а решить проблему где-то еще.Проблема изначально возникла при чтении действия в общих чертах.Теперь предположительно «ошибочные» действия будут просто игнорироваться. Это соответствующий патч.

...