Как найти и заменить текст в существующем файле PDF на PDFTK (или другое приложение командной строки) - PullRequest
18 голосов
/ 26 марта 2012

На каждой странице моего PDF-документа есть строка с этой строкой:

%REPLACE%

Который я бы хотел найти и заменить другой строкой.

Кто-нибудь знает, как это сделать с помощью приложения для командной строки, такого как PDFTK?

Этот народ дал мне важную подсказку, однако я бы хотел что-то более прямое.

Спасибо.

1 Ответ

36 голосов
/ 26 марта 2012

Вы можете попытаться изменить содержимое вашего PDF следующим образом

  1. Распаковать текстовые потоки PDF

    pdftk file.pdf output uncompressed.pdf uncompress
    
  2. Использовать sed , чтобы заменить ваш текст другим

    sed -e "s/ORIGINALSTRING/NEWSTRING/g" <uncompressed.pdf >modified.pdf
    
  3. Если эта попытка была успешной, повторно сожмите PDF с pdftk

    pdftk modified.pdf output recompressed.pdf compress
    

Примечание: Этот способ не всегда удачен , в основном из-за поднабора шрифтов

...