декодирование потока страниц PDF (я не знаю, какое конкретно c имя) - PullRequest
0 голосов
/ 21 марта 2020

Я ищу, как декодировать поток страниц PDF (в качестве заголовка я не знаю, укажите c имя).

Это выглядит так

/OC /MC0 BDC ./Artifact <</O /Layout >>BDC .BT./CS0 cs 0.075 0.463 0.78  scn./GS0 gs./T1_0 1 Tf.18.75 0 0 18.75 40.1772 552.638 Tm.[(AF t)15(oolkit )]TJ.ET.EMC ./Artifact <</O /Layout >>BDC .BT./T1_1 1 Tf.18.75 0 0 18.75 140.6188 552.638 Tm.[(Det)15(ect, Pr)25(ot)15(ect a

Я мог бы найти некоторые ключевые слова (BT, Tm, и т. д. c) в Google. Однако я не могу найти другие ключевые слова, такие как / O C, / MC0 BD C ...

Итак, Кто-нибудь знает, как это работает для всех ключевых слов?

Спасибо.

1 Ответ

1 голос
/ 21 марта 2020

Вы должны просто найти спецификацию , то есть ISO 32000. Adobe опубликовала копию первой версии, ISO 32000-1: 2008, на своем веб-сайте для бесплатной загрузки. В этом экземпляре заголовки страниц ISO были заменены (поэтому вы не можете использовать его для аудита и т. Д. c), но техническое содержимое не затронуто. Просто Google для PDF32000, в настоящее время он на https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/PDF32000_2008.pdf, но это не может быть постоянная ссылка.

Тем не менее, имейте в виду, что некоторые слова, которые вы ищете, являются именами, которые являются определено в вашем PDF-файле. Например, в вашем

/OC /MC0 BDC
    ...
EMC

MC0 - произвольное имя в ресурсах вашего потока контента, поэтому поиск по этому имени или поиск в спецификации не помогут. Вместо этого поищите здесь инструкции BD C и EM C, объяснение которых расскажет, как интерпретировать эти имена.

Но на самом деле это Пример также иллюстрирует исключение из приведенного выше совета, потому что имя O C является особенным, поэтому его поиск поможет вам в этом.

В этом примере BD C и EM C пара инструкций охватывает помеченное содержимое, , которое здесь используется для определения необязательное содержимое (таким образом, O C name), а имя MC0 просто является именем ресурса свойств, который описывает необязательную группу содержимого в вопросе.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...