Я не думаю, что Distiller поддерживает что-либо в этом роде.
Я предлагаю вам найти лучший способ извлечь ваш текст.Даже если весь ваш текст использует Tj
вместо одного из других операторов отображения текста (не только TJ), у вас все равно будут проблемы, если вы столкнетесь с пользовательской кодировкой.Пусть кто-нибудь, кто уже решил эту проблему, сделает это за вас.
Существует множество программ, которые могут неплохо справиться с извлечением текста из PDF.Лучшим по-прежнему остается Acrobat / Reader ... поэтому, если вы не можете выбрать / скопировать / вставить текст из Reader, тогда никакое другое программное обеспечение не сможет работать ... сохранить OCR ( O potical C характер R признание).
Я склонен к iText (Java) и iTextSharp (C #)... Я коммитерТем не менее, есть довольно много других приложений, делающих в основном одно и то же ... сидящих в разных местах на бесплатном / свободном программном / коммерческом спектре.Черт, iTexts сидят в нескольких местах в этом спектре.: Rolleyes: