извлечь PDF форматирование - PullRequest
0 голосов
/ 04 августа 2011

Привет, ребята, работающие над приложением, основной работой которого является редактирование PDF.

Я понимаю, что Apple не предоставляет API для редактирования PDF.но мои требования такие.

, поэтому я подумал о том, чтобы извлечь все содержимое файла PDF и создать новый файл PDF после редактирования.Теперь мне нужно знать, как извлечь форматирование PDF (верхний и нижний колонтитулы, изображения, подсветка. ,,)

im, используя операторы Tj для извлечения PDF-текста.какие операторы я должен использовать для извлечения другой информации из pdf файла.

заранее спасибо.

1 Ответ

0 голосов
/ 04 августа 2011

Изображения нарисованы на странице с помощью оператора Do. Его операндом является имя изображения в словаре ресурсов. Оператор Do также рисует формы XObjects (автономную векторную графику), и они также хранятся в словаре ресурсов. Ключ Subtype в словаре изображения / формы XObject предоставляет тип объекта: «Изображение» для изображений и «Форма» для формы XObjects.
Другими элементами являются обычная векторная графика и текст, файлы PDF не имеют верхних и нижних колонтитулов, абзацев и т. Д. В качестве отдельных объектов. То, что вы видите визуально как верхний колонтитул страницы, внутри файла PDF представляет собой простой текст, нарисованный в верхней части страницы.
Выделения могут быть простыми полупрозрачными желтыми прямоугольниками (они ничем не отличаются от других прямоугольников на странице) или аннотации выделения (они доступны в массиве Annots страницы).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...