Как я могу преобразовать последовательность байтов Unicode в XML-сущность? - PullRequest
0 голосов
/ 03 февраля 2012

Я хочу, чтобы на моем сайте вместо смайликов появлялись символы tsu (ツ) из Катаканы.

Я уже нашел последовательность байтов, которая \343\203\204, но я не знаю, как представить это как сущность XML, чтобы я мог отобразить ее на странице HTML.

Ответы [ 2 ]

1 голос
/ 03 февраля 2012

Если ваш стек преобразований XML-в-HTML (и веб-сервер, доставляющий страницы HTML) должным образом поддерживает юникод, это должно быть так же просто, как написание кодовой точки юникода как объекта (&x30c4;).Если они не ... ну, удачи 100

0 голосов
/ 03 февраля 2012

Вы всегда можете использовать символьную ссылку ツ (на основе номера Unicode в шестнадцатеричном формате), независимо от кодировки документа.

Под обозначением \343\203\204 вы, вероятно, подразумеваете восьмеричное представление трех байтов,составляют кодированное представление UTF-8 символа.Данные, состоящие из этих байтов, могут быть включены как таковые в документ XML, если его кодировка UTF-8 (по умолчанию).То, как вы это сделаете, зависит от программы, использованной для создания файла XML.

Эти соображения также применимы к HTML, в формате XHTML или нет.На практике, если вы собираетесь использовать символ на веб-странице, могут возникнуть проблемы со шрифтами, поскольку большинство шрифтов не содержат его.Поэтому создание подходящего шрифта в CSS - хорошая идея.Дополнительная информация: http://www.cs.tut.fi/~jkorpela/html/characters.html

...