2 кодировки между представлением HTML - PullRequest
0 голосов
/ 09 июля 2011

Я читаю одну главу из W3C Представление HTML-документа

В 5.1 сказано это:

Пользовательские агенты также должны знать конкретную кодировку символов, которая использовалась для преобразования потока символов документа в поток байтов.

Тогда в 5.2 говорится это:

Параметр "charset" определяет кодировку символов, которая представляет собой метод преобразования последовательности байтов в последовательность символов.

Char-Б

Б-Char

Так что я не прав или есть 2 кодировки между представлением ...

1 Ответ

1 голос
/ 09 июля 2011

«Кодировка символов», такая как UTF-8, строго говоря, является спецификацией для представления символов в виде последовательности байтов. Но кодировки всегда обратимы, поэтому мы можем говорить о (одиночной) кодировке символов как о двух направлениях.

Другими кодировками символов, используемыми на практике, являются UTF-16 и UTF-32.

Каждая из них является спецификацией, согласно которой вы можете кодировать текст как байты и декодировать байты в символы. Две части одной спецификации.

...