как получить текст из identity-h в кодировке pdf - PullRequest
0 голосов
/ 24 января 2011

мне удалось получить текст из pdf с помощью TJ, обратных вызовов оператора Tj ... но некоторые тексты по-прежнему отсутствуют, которые имеют идентификацию h-кодирования ... как преобразовать его в текст / NSString ???

1 Ответ

2 голосов
/ 08 февраля 2011

Кодировка Identity-H подразумевает шрифт Type0 (также известный как шрифт с CID-ключами), поэтому вам нужно обратиться к встроенному отображению ToUnicode.Символы, которые вы получаете в TJ, Tj, одинарных кавычках и двойных кавычках (четыре оператора отображения текста), не являются юникодом, а представляют собой произвольные идентификаторы символов, которые не имеют большого значения вне текущего шрифта.очень ясно, но довольно требовательное чтение.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...