Генерация ToUnicode CMaps (программно или визуально) - PullRequest
0 голосов
/ 15 апреля 2020

У меня есть несколько проблемных c PDF-файлов, которые я пытаюсь преобразовать в PDF / A-1a.

В этих документах используются встроенные подмножества CID Identity-H, созданные с помощью Acrobat Distiller 20.0. Я выполнил поиск инструментов, которые могли бы использовать OCR для сканирования отрендеренного вывода с целью либо автоматического генерирования отсутствующих CMAP-кодов ToUnicode, либо, по крайней мере, предложения кандидатов с высокой вероятностью для выбора пользователя, но пока не увенчались успехом.

Глифы хорошо читаются. Если это не самый предпочтительный метод построения ToUnicode CMaps для этих файлов, существует ли общая визуальная утилита (или метод) для построения кодовых точек? Я попытался извлечь шрифт в FontForge, что не удалось (вывод FontForge утверждает, что файлы PDF не читаются).

Спасибо!

...