Генерация PDF только с Tj Operator - PullRequest
1 голос
/ 03 июня 2011

Я хочу сгенерировать PDF-файлы или преобразовать существующие PDF-файлы, использующие оператор Tj для обозначения строки с Tl для обозначения текстового опережения, и она не должна содержать оператор TJ и оператор TD. То, что я должен установить в настройках сервера acrobat дистиллятор 6.0.1 или Adobe Illustrator. Помогите мне в этом вопросе.

В настоящее время я использую эти операторы для идентификации и поиска текста и сохранения их в качестве словаря для моих целей.

1 Ответ

0 голосов
/ 06 июня 2011

Я не думаю, что Distiller поддерживает что-либо в этом роде.

Я предлагаю вам найти лучший способ извлечь ваш текст.Даже если весь ваш текст использует Tj вместо одного из других операторов отображения текста (не только TJ), у вас все равно будут проблемы, если вы столкнетесь с пользовательской кодировкой.Пусть кто-нибудь, кто уже решил эту проблему, сделает это за вас.

Существует множество программ, которые могут неплохо справиться с извлечением текста из PDF.Лучшим по-прежнему остается Acrobat / Reader ... поэтому, если вы не можете выбрать / скопировать / вставить текст из Reader, тогда никакое другое программное обеспечение не сможет работать ... сохранить OCR ( O potical C характер R признание).

Я склонен к iText (Java) и iTextSharp (C #)... Я коммитерТем не менее, есть довольно много других приложений, делающих в основном одно и то же ... сидящих в разных местах на бесплатном / свободном программном / коммерческом спектре.Черт, iTexts сидят в нескольких местах в этом спектре.: Rolleyes:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...