Объектная модель Acrobat JS не позволит вам изменять содержимое страницы, нет.
В любом случае вставлять один шрифт в другой - вообще плохая идея, если говорить визуально. Соответствующий интервал между буквами может варьироваться от одного шрифта к другому, чтобы ваш вывод выглядел ... ну ... ужасно. Этот искаженный интервал может также приводить к появлению алгоритмов «поиска слов», заставляя их думать, что есть разрывы слов там, где их нет, или думать, что два или более слова - это одно большое слово.
Не очень.
Также вполне возможно, что настоящей проблемой является сам шрифт. Даже вероятно кодировка шрифта в том, что это проблема, а не сам шрифт. Способ, которым байты в потоке контента интерпретируются как символы.
Вы можете увидеть кодировку, используемую различными шрифтами, на вкладке «шрифты» диалогового окна свойств документа (control + d). Я подозреваю, что ваши неариальные шрифты используют что-то необычное ... "Identity-H" или "Custom", скорее всего.
Изменение кодировки текста в PDF - очень сложная проблема.
Наконец, чтобы посмотреть, возможно ли даже теоретически извлечь текст, попробуйте скопировать и вставить его из PDF в Acrobat. Если вы можете сделать это, то и другая программа тоже. Если вы не можете (или это выглядит как мусор), то другие программы могут столкнуться с аналогичным отсутствием успеха.
В этот момент единственное, что вы можете сделать, - это OCR. Оптическое распознавание символов. Я считаю, что Acrobat Pro поставляется с простой программой OCR, хотя я могу ошибаться. Я никогда не использовал это.