Цвет текста и другой заполненной графики устанавливается с помощью одного из операторов g
, rg
или k
в объекте потока содержимого в файле PDF, как описано в разделе 4.5.7 Цвет Операторы в справочном руководстве PDF.
Пример G.3 Пример простой графики в справочном руководстве показывает, что эти операторы используются для обводки и заливки некоторых фигур (но не текста).
http://www.adobe.com/devnet/pdf/pdf_reference.html
При самостоятельном разборе файла PDF вы начинаете с чтения трейлера
в конце файла, который содержит смещение файла
таблица перекрестных ссылок . Эта таблица содержит смещение файла
каждый объект в файле PDF. Объекты в древовидной структуре со ссылками
к другим объектам. Один из объектов будет
поток контента. Это описано в разделах 3.4 Структура файла
и 3.6 Структура документа в справочном руководстве в формате PDF.
Можно проанализировать файл PDF самостоятельно, но это
довольно много работы. Содержимое
поток может быть сжат, содержать ссылки на другие объекты,
содержать комментарии и т. д., и вы должны рассмотреть все эти случаи.
Программное обеспечение PDFMiner уже читает поток контента. Возможно это
было бы проще расширить PDFMiner, чтобы сообщить цвет
текста тоже?