Я PHP Разработчик по профессии.
Рассмотрим пример ниже:
Я хочу закодировать слово "привет" , используя UTF-8 кодировка.
Итак,
Эквивалентный код Точки каждой из букв слова "привет" указаны ниже:
h = 104
e = 101
l = 108
o = 111
Итак, мы можем сказать, что список десятичных чисел представляет строку "привет" :
104 101 108 108 111
Кодировка UTF-8 будет хранить "привет" следующим образом (двоичный код):
01101000 01100101 01101100 01101100 01101111
Если вы внимательно наблюдаете вышеупомянутое двоичное кодированное значение, вы узнаете, что каждыйдвоичному эквиваленту десятичного числа предшествует двоичное значение бита 0
.
Мой вопрос заключается в том, почему этот начальный 0
имеет префикс перед каждым сохраняемым символом?Какова цель использования его в кодировке UTF-8?
Что было сделано, когда та же строка кодируется в формате UTF-16 ?
Если это необходимотогда может ли начальный дополнительный символ быть битовым значением 1
?
Значит ли NUL Byte двоичный символ 0
?