почему кодировка utf-8 не использует 4 шестнадцатеричные цифры. Он отображает 4 шестнадцатеричные цифры кода точки на пару из 2 шестнадцатеричных цифр - PullRequest
0 голосов
/ 03 февраля 2020

У меня есть символ Unicode Ņ, чей HEX U+0145 и целое число 325

При кодировании с использованием UTF-8 в байтах он не представлен как \x145 [= 325 base10], но представлен как \xc5\x85 т.е. в юникоде \xc5 [197 base10] - Å and \x85 [133 base10] (i.e = 197 + 133 = 330 != 325)

Почему это так.

Одним из преимуществ является то, что при использовании двух шестнадцатеричных цифр git он будет использовать 1 байт (2 шестнадцатеричных цифры используют 4 x 2 = 8 бит)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...