Santhosh Yedidi 03 февраля 2020 26

почему кодировка utf-8 не использует 4 шестнадцатеричные цифры. Он отображает 4 шестнадцатеричные цифры кода точки на пару из 2 шестнадцатеричных цифр

Santhosh Yedidi / 03 февраля 2020

У меня есть символ Unicode Ņ, чей HEX U+0145 и целое число 325

При кодировании с использованием UTF-8 в байтах он не представлен как \x145 [= 325 base10], но представлен как \xc5\x85 т.е. в юникоде \xc5 [197 base10] - Å and \x85 [133 base10] (i.e = 197 + 133 = 330 != 325)

Почему это так.

Одним из преимуществ является то, что при использовании двух шестнадцатеричных цифр git он будет использовать 1 байт (2 шестнадцатеричных цифры используют 4 x 2 = 8 бит)

...

почему кодировка utf-8 не использует 4 шестнадцатеричные цифры. Он отображает 4 шестнадцатеричные цифры кода точки на пару из 2 шестнадцатеричных цифр

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

почему кодировка utf-8 не использует 4 шестнадцатеричные цифры. Он отображает 4 шестнадцатеричные цифры кода точки на пару из 2 шестнадцатеричных цифр

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы