Известно, что в Си строка представлена массивом char
с.
. И в большинстве 32-разрядных процессоров char
занимает один байт или восемь битов.И строка состоит из массива из одного byte
с.
Поскольку расширенные символы, такие как китайский и японский, занимают больше битов, чем 8 бит, я немного запутался в этом материалевокруг этого.
Например, я протестировал, что могу определять массив китайских символов так же, как и массив английских букв, используя синтаксис, такой как char array[100]
.Итак, мой вопрос:
Существует ли механизм, который пытается преодолеть разрыв между общими 8-битными символами и символами больше 8-битных, чтобы они рассматривались как одинаковые, так же, как у меняупомянутое выше.