Понять структуру PDF с Flatedecode - PullRequest
0 голосов
/ 05 февраля 2019

Добрый день!

Я читаю документацию в формате PDF, но у меня есть некоторые глобальные проблемы.

https://www.adobe.com/content/dam/acom/en/devnet/acrobat/pdfs/PDF32000_2008.pdf

Мне нужна таблица внешних ссылок из файла PDF с помощью Cross-Ссылочные потоки.

Это файл PDF https://ufile.io/q77el

Часть файла PDF: startxref 22827515 %% EOF

Эта часть:

6628 0 obj
<<
/W [1 4 1]
/Info 1 0 R
/Root 2 0 R
/Size 6629
/Type /XRef
/Filter /FlateDecode
/Length 3996
/DecodeParms <<
/Columns 6
/Predictor 12
>>
>>
stream
  xÚí]{|ŽåŸç=ïÝf6­LNIŒ³ŒeHŽ;ÙæÜÁ!D¥ƒèWé...
endstream

Я нашел этот текст, использую функцию gzucompress и у меня есть

$a = gzuncompress(substr($match[2][0],1,-1));

0200 0000 0000 ff02 0200 0000 0301 02ff
0000 000c 0002 0000 000f 7e00 0201 0000
f176 0102 ff00 0000 c2ff 0201 0000 003e
0202 0000 0000 0001 0200 0000 0000 0102
0000 0000 0001 0200 0000 0000 0102 0000
0000 0001 0200 0000 0000 0102 ff00 000d
3bf8 0201 0000 f3c5 0902 0000 0000 0001
0200 0000 0000 0102 0000 0000 0001 0200
0000 0000 0102 0000 0000 0001 0200 0000
0000 0102 0000 0000 0001 0200 0000 0000

txt файл

Но что это значит?Я вижу, что / W [1 4 1] означает, что мне нужно разбить строку на 3 части: 1 байт 4 байта 1 байт

02 00000000 00 ff 02020000 00 03 0102ff00 00 00 0c000200 00

Но это не работает.пожалуйста, скажите мне, каков мой следующий шаг.Спасибо!

1 Ответ

0 голосов
/ 12 февраля 2019

Ответ - предикторная информация./ Столбцы 6 - означают, что сплин на n + 1 / Предиктор 12 - означают, что это png алгоритм

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...