О, мальчик.
«Кодирование» в PDF может означать несколько вещей, с которыми вы, вероятно, не хотите связываться.
PDF - это не какая-то разметка XML, где все в одной кодировке. Каждый шрифт может (и часто делает) определять свою собственную (возможно, настраиваемую) кодировку, которая используется для определения того, какие глифы из этого шрифта должны быть нарисованы, учитывая байты в потоке контента. Упомянутый шрифт не обязателен и для перехода от глифов к символам.
«Глиф» - это кучка загогулинов в конкретной конфигурации. Это чисто графический
«Символ» имеет значение, является частью алфавита и т. Д. Это чисто логично.
Итак, я должен спросить: почему вы хотите изменить кодировку ваших PDF-файлов. Какова цель? Вы пытаетесь получить текст из ваших PDF-файлов, но не можете это сделать и думаете, что это может помочь?