Как исправить квадратные коробки в PDF? - PullRequest
1 голос
/ 21 сентября 2011

при просмотре моего pdf для регулярных выражений, и во многих местах я вижу, что некоторые символы заменяются квадратными рамками, что является кодом ASCII

Можно ли как-нибудь это исправить?

Я проверил эту ссылку

http://www.tableausoftware.com/support/knowledge-base/square-boxes
http://acrobatusers.com/tutorials/text-matching-regular-expressions

и другие, но не нашли никакого решения ... приковано то, как выглядят квадратные квадраты ...

enter image description here

Ответы [ 3 ]

2 голосов
/ 21 сентября 2011

Как сказала stema , это не имеет ничего общего с регулярными выражениями.

И не о некоторых "escape-последовательностях pdf", поскольку PDF использует двоичные безопасные кодировки текста.

Эти квадратные блоки обычно отображаются вместо некоторых символов, которые не имеют представления в выбранном шрифте.Часто случается, что программное обеспечение для набора текста заменяет некоторые кавычки или другие символы более «хорошей» альтернативой Unicode;но шрифт не содержит этих символов.

Вы можете попробовать скопировать / вставить текст из PDF-документа в другой документ и заменить шрифт, или даже использовать некоторые инструменты редактирования PDF ( enfocus PitStop является одним из самых популярных, это дешево, но не бесплатно) заменить шрифт другим более полным.

1 голос
/ 21 сентября 2011

Во-первых, это не имеет ничего общего с регулярным выражением, за исключением того, что документ, который вы пишете, касается регулярных выражений.

Я полагаю, последовательность, которая заменяется квадратом, \s, не так ли?

Я думаю, что проблема здесь в том, что некоторые ярлыки регулярных выражений интерпретируются как escape-последовательности в процессе создания pdf и поэтому буквально не печатаются.

Вы не пишете, как создаете свой pdf, но я предполагаю, что все будет в порядке, если вы избежите обратной косой черты, когда вы хотите распечатать их буквально.

Поэтому, если вы хотите увидеть \s в pdf, введите \\s в исходном формате. (Если у вас есть экранированный обратный слеш, который вы хотите напечатать как \\, напишите \\\\).

0 голосов
/ 05 декабря 2011

Ответ Хавьера почти завершен. Но позвольте мне добавить это:

У вас будет небольшой шанс заставить Acrobat Reader отображать квадратные поля, используя «замещающий» шрифт, переключая определенный параметр в настройках своего приложения.

IIRC, настройка называется 'Использовать локальные шрифты' . Обычно вы можете найти его в разделе Отображение страницы настроек, но в разных выпусках Adobe продолжала добавлять, удалять или перемещать разные настройки ...

Справочная информация: Если у вас НЕ включен Использовать локальные шрифты , то вам требуется, чтобы Reader использовал только встроенные в PDF шрифты для отображения всего текста , В случае, если шрифт встроен, но пропускает некоторые необходимые глифы, включение указанного параметра может найти требуемый шрифт в вашей системе для визуализации текста, или Reader может использовать встроенный Multiple Master шрифтов, которые будут пытаться имитировать внешний вид исходного символа, более или менее ....

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...