Изменить шрифт программно в Acrobat Pro 9.1 - PullRequest
1 голос
/ 16 декабря 2010

У меня большой PDF-файл, который использует несколько шрифтов. Я должен экспортировать его в другое приложение, которое распознает только шрифты Arial или Times New Roman. Возможно ли сделать это в Javascript? Я попробовал это без удачи:

/* Changes font to Arial */
var ckWord, numWords;
for (var i = 0; i < this.numPages; i++)
{
    numWords = this.getPageNumWords(i);
    for (var j = 0; j < numWords; j++) {
        ckWord = (this.getPageNthWord(i,j))
         if (ckWord.font != "Arial") {
              ckWord.font = "Arial";

            }
        }
}

1 Ответ

0 голосов
/ 16 декабря 2010

Объектная модель Acrobat JS не позволит вам изменять содержимое страницы, нет.

В любом случае вставлять один шрифт в другой - вообще плохая идея, если говорить визуально. Соответствующий интервал между буквами может варьироваться от одного шрифта к другому, чтобы ваш вывод выглядел ... ну ... ужасно. Этот искаженный интервал может также приводить к появлению алгоритмов «поиска слов», заставляя их думать, что есть разрывы слов там, где их нет, или думать, что два или более слова - это одно большое слово.

Не очень.

Также вполне возможно, что настоящей проблемой является сам шрифт. Даже вероятно кодировка шрифта в том, что это проблема, а не сам шрифт. Способ, которым байты в потоке контента интерпретируются как символы.

Вы можете увидеть кодировку, используемую различными шрифтами, на вкладке «шрифты» диалогового окна свойств документа (control + d). Я подозреваю, что ваши неариальные шрифты используют что-то необычное ... "Identity-H" или "Custom", скорее всего.

Изменение кодировки текста в PDF - очень сложная проблема.

Наконец, чтобы посмотреть, возможно ли даже теоретически извлечь текст, попробуйте скопировать и вставить его из PDF в Acrobat. Если вы можете сделать это, то и другая программа тоже. Если вы не можете (или это выглядит как мусор), то другие программы могут столкнуться с аналогичным отсутствием успеха.

В этот момент единственное, что вы можете сделать, - это OCR. Оптическое распознавание символов. Я считаю, что Acrobat Pro поставляется с простой программой OCR, хотя я могу ошибаться. Я никогда не использовал это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...