xml: lang в сериализации text / html только для того, чтобы позволить авторам писать документы полиглота - документы, которые являются действительными XHTML5 и действительными HTML5.
В HTML (в отличие от XHTML) xml: lang вообще не является атрибутом в пространстве имен XML, это атрибут в пустом пространстве имен, называемый xml:lang
. то есть двоеточие вообще не имеет магических свойств, это просто еще один символ в имени атрибута, как и любой другой.
Чтобы ответить на вопрос, который у вас изначально был о en-US-x-hixie
:
en-US-x-hixie
- это en-US
(т.е. американский английский) плюс частный подтег -x-hixie
, означающий вариант английского языка США, написанный Ианом Хиксоном, редактором HTML5.
Подтеги частного использования определены в RFC: 5646, BCP 47 http://www.ietf.org/rfc/bcp/bcp47.txt
Сечение 2.2.7. Private Use Subtags