Основываясь на полученных мной комментариях, я немного углубился в это. Похоже, что в настоящее время рекомендуется отказаться от использования сущностей HTML и использовать вместо него настоящий символ UTF-8 . Причины перечислены ниже:
- Кодировки UTF-8 легче читать и редактировать для тех, кто понимает, что означает символ и знает, как его набирать.
- Кодировки UTF-8 столь же неразборчивы, как и кодировки сущностей HTML, для тех, кто их не понимает, но у них есть преимущество в том, что они представляют собой специальные символы, а не трудные для понимания десятичные или шестнадцатеричные кодировки.
Пока кодировка вашей страницы правильно установлена на UTF-8, вы должны использовать реальный символ вместо HTML-сущности. Я прочитал несколько документов на эту тему, но самыми полезными были:
Из UTF-8: Секрет кодирования символов статья:
Википедия - отличный пример для
приложение, которое первоначально использовалось
ISO-8859-1, но переключился на UTF-8, когда
это стало слишком громоздким, чтобы поддерживать
иностранные языки. Боты теперь будут
на самом деле просматривать статьи и
конвертировать персонажи в свои
соответствующие реальные символы для
ради удобства и
* 1029 возможность поиска *.
В этой статье также приведен хороший пример китайской кодировки. Вот сокращенный пример для лени:
UTF-8
這兩個字是甚麼意思
HTML-сущности :
這兩個字是甚麼意思
Кодировки сущностей UTF-8 и HTML для меня бессмысленны, но по крайней мере кодировка UTF-8 распознается как иностранный язык и будет правильно отображаться в окне редактирования. Далее в статье говорится о версии, закодированной в HTML-формате:
Чрезвычайно неудобно для тех из нас,
кто на самом деле знает, какой персонаж
сущности, совершенно неразборчиво
бедным пользователям, которые этого не делают! Даже
немного более удобный,
"понятные" персонажи типа
& Тэта; оставит пользователей, которые
не заинтересован в изучении HTML
почесывая головы. С другой
стороны, если они видят θ в окне редактирования,
они будут знать, что это особенный
характер, и относиться к нему соответственно,
даже если они не умеют писать
сами эти персонажи.
Как уже отмечали другие, вам все равно придется использовать сущности HTML для зарезервированных символов XML (амперсанд, меньше, больше, чем).