Как 4-байтовые символы представлены в C #? Как один символ или набор из 2 символов?
var someCharacter = 'x'; //put 4 bytes UTF-16 character
C # может хранить символы только с Basic Multilingual Plane в типе char. Для символов вне этой плоскости должны использоваться два char s - называемые суррогаты .
char
Вы также можете использовать строковый литерал, например:
string s = "\U0001D11E";
См. UTF-16 .