Какой самый длинный символ UTF-8 в байтах, который также присутствует в UCS-2? - PullRequest
2 голосов
/ 24 июня 2011

Я хотел бы знать, какой символ Unicode присутствует в кодировке UCS-2 и UTF-8, который имеет самый длинный размер в байтах в UTF-8.

1 Ответ

3 голосов
/ 24 июня 2011
  • UCS-2 может кодировать только кодовые точки в диапазоне от U + 0000 до U + FFFF
  • UTF-8 требуется максимум 3 байта для кодирования значений в этом диапазоне.

Таким образом, кодируемые UCS-2 кодовые точки с самым длинным представлением в UTF-8 будут от U + 0800 до U + FFFF.

...