Как 4-байтовые символы представлены в C # - PullRequest
7 голосов
/ 20 октября 2011

Как 4-байтовые символы представлены в C #? Как один символ или набор из 2 символов?

var someCharacter = 'x'; //put 4 bytes UTF-16 character

1 Ответ

11 голосов
/ 20 октября 2011

C # может хранить символы только с Basic Multilingual Plane в типе char. Для символов вне этой плоскости должны использоваться два char s - называемые суррогаты .

Вы также можете использовать строковый литерал, например:

string s = "\U0001D11E";

См. UTF-16 .

...