Я знаю, что это очень глупый вопрос, но, к сожалению, не мог понять это самостоятельно. У меня всегда возникает путаница, когда речь идет о темах кодирования и набора символов. Я объясню, что я понимаю из топи c, затем я задам свои вопросы.
, когда вы хотите сохранить файл, вы делаете это в определенной кодировке символов, что означает, что каждый символ файл помещается в память в соответствии с его кодировкой. правильно?
например, если файл html
имеет кодировку utf-16
, означает ли это, что браузер использует кодировку utf-16
для декодирования данного файла для чтения исходного кода ?
с использованием атрибута charset
в элементе meta
определяет, какую кодировку должен использовать язык (html
) для правильного отображения символов в браузере?
и html
добавили "html ссылка на символ "сама по себе, и она не имеет ничего общего с кодами символов Юникода?
Edit1 :
, поэтому после @snakecharmerb я осознал некоторые из своих ошибок:
1- Я не знал, что метаданные о кодировке [текстовых файлов] отсутствуют.
2 - атрибут charset
сообщает браузеру кодировку файла, поскольку эта информация может не может быть задуман из самого файла (до в некоторой степени он может. См. этот ответ)
3 - текстовый файл может иметь только одну кодировку, и если файл закодированный с utf-8 это означает, что это следует за Набором символов Unicode (UCS). Вы не можете использовать кодировку utf-8 с другим набором символов, и сегодня термины utf-8 и unicode практически взаимозаменяемы.