Некоторые китайские и японские символы выглядят искаженными в IE / FF - PullRequest
1 голос
/ 22 ноября 2011

У нас есть сайт для рендеринга контента, который отображает контент на нескольких языках.Сайт построен с использованием JSP и контента, полученного из базы данных Oracle.Все наши страницы соответствуют UTF-8.

При отображении содержимого zh / jp из всего содержимого искажается только часть символов (квадратные прямоугольники в IE и алмазные вопросительные знаки в FF).Данные в БД не имеют искаженного символа.Поскольку мы не понимаем язык, мы не знаем, какие символы проблематичны.Буду признателен за некоторые указания на решение, пожалуйста.Может ли быть так, что некоторые символы могут показаться недопустимыми в браузерах?

Пример на FF:

*1009*ル 者 が プ リ ケ ー シ の の の の ュ ル ル ホ ル 脆弱 脆弱 (性 性)

1 Ответ

0 голосов
/ 22 ноября 2011

Сомневаясь в правильности кодировки UTF-8, вы всегда можете перекодировать ее либо с помощью хорошего текстового редактора, либо с помощью специального инструмента, такого как iconv:

 iconv -f UTF-8 -t UTF-8 yourfile > youfile2

Если ваш файл действительноНеправильно, iconv также даст вам некоторую информацию о проблеме.

Но, другой способ, который вы могли бы изучить, - это установка новых шрифтов для дальневосточных языков…

Действительно, не зная действительных байтовПри использовании в вашем файле трудно сказать, почему их заменяют символом замены U (U + FFFD).Таким образом, вы можете захотеть опубликовать шестнадцатеричный дамп частей вашего файла, которые не работают.

...