Какие языки UTF-8 могут отображаться «безопасными» в HTML без каких-либо специальных настроек представления? - PullRequest
1 голос
/ 31 марта 2011

Для моей собственной CMS я почти закончил языковой менеджер, который позволит владельцам сайтов на лету создавать новые языки для своего сайта.Дело в том, что, рассматривая языки латинского алфавита как язык по умолчанию, на данном этапе я хочу поддерживать только те языки, которые не требуют специальных настроек представления, например direction: rtl; для арабских языков и того, что у вас есть.

Какие языки (или группы языков, такие как латынь) обычно не нуждаются в какой-либо из этих настроек для правильного отображения?Или скорее возможно;Какой тип языков обычно нужен , требуют ли эти типы настроек?(какую бы категорию меньше не упоминать :))

1 Ответ

2 голосов
/ 02 апреля 2011

Я не совсем уверен, что вы имеете в виду под «настройками представления».И какое это имеет отношение к UTF-8.

Во-первых, UTF-8 - это просто кодировка символов, способ представления Unicode.Он способен отображать любой национальный символ (единственными проблемами могут быть всплывающие дополнительные 4-байтовые китайские символы, определенные в GB18030: 2005, но с Unicode 6.0, я думаю, это исчезнет).

Еще одна вещь: не-Латинские скрипты могут потребовать корректировок в любом случае - в любом случае, возможно, потребуется изменить грань и размер шрифта.

Третье: вы упомянули направление: rtl, которое является ключевым словом CSS.Проблема в том, что вам лучше использовать HTML-атрибут dir для переключения направления - это соответствует рекомендациям W3C .

Последнее: я бы не стал исправлять список языков RTL, скажем, по-арабски, Иврит, урду и персидский (фарси), так как есть другие языки би-ди .

Другими словами, я бы подумал, что делать, чтобы разрешить изменение стиля и направленности для концапользователь, а не жестко его кодировать.

...