Я только начинаю что-то похожее (автоматическое редактирование адресов электронной почты и телефонных номеров, к которому затем будут добавлены дополнительные ручные изменения, когда моя подруга работает в школе и в настоящее время делает все это вручную), и быстро доказательство концепции сегодня утром. Я использовал эту библиотеку:
https://github.com/JoshData/pdf-redactor
Изменив пример на наличие подходящего регулярного выражения для электронных писем и изменив замещающий текст на «email redacted», я запустил его и запустил через несколько минут. Очевидно, что еще многое предстоит сделать, но похоже, что редактор pdf сделает большую работу в моем случае - это может быть хорошей отправной точкой для вас?