Подчеркнутые символы выглядят странно (их акценты отображаются после символа) после вставки - PullRequest
0 голосов
/ 01 сентября 2011

Не уверен, что это подходящее место, чтобы спросить или doctype, но я все равно буду спрашивать ... Я работал с немецким клиентом, и эта очень странная проблема начала проявляться ..

Поэтому, заполняя контент для веб-сайта, я копирую / вставляю их PDF-лист в мой редактор (Espresso). Самое странное, что в то время как весь текст в редакторе выглядит нетронутым, при открытии в браузере мы начинаем получать странные аномалии с акцентами акцентированного символа, продвигаясь вперед. Так что «Ö» отображается как O »и так далее.

Я думал, что это была какая-то проблема с юникодом, но сайт объявлен как utf8, и нет никакого расширенного текста или чего-либо вводимого, это просто необработанный текст из редактора. Так что это действительно ошеломляет. Если клиент редактирует файлы напрямую, он отображается правильно. И я узнал, что если я набираю и заменяю символы с акцентом вручную, это тоже нормально.

У кого-нибудь был подобный опыт / решения?

Хотелось бы, чтобы не было проблем с локализацией / шрифтом, так как это по сути символы латинского алфавита? (поправьте меня, если я ошибаюсь)

1 Ответ

3 голосов
/ 01 сентября 2011

Вы не можете надежно вырезать и вставлять из PDF.Внутренний формат не такой, как кажется.: -)

PDF-файлы могут использовать специальные кодировки внутри, чтобы печатная страница выглядела правильно, но это не значит, что вы можете копировать вставить.

Вот вопрос StackExchange, который имеет немного немного фона: https://tex.stackexchange.com/questions/22213/how-to-get-accented-unicode-characters-that-can-be-copy-pasted.

Хотя это не совсем тот же вопрос, что и у вас, он показывает, что способ создания PDF имеет значение.Возможно, что некоторые символы Latin-1 (с ударением) кодируются в PDF-файле не как символы с ожидаемой кодовой (-ыми) точкой (-ами) Юникода, а с инструкциями по рисованию для правильного отображения символа.

Возможно thisпродукт может помочь вам.Я не использовал его, поэтому не могу рекомендовать его, но небольшой поиск может дать то, что вы можете использовать.(Этот утверждает, что поддерживает немецкий.)

...