Юникод прописные / строчные - PullRequest
0 голосов
/ 04 февраля 2020

В Win32-API есть две функции, называемые CharLowerBuff и CharUpperBuff. Для обоих есть варианты char и Unicode (Unicode-API Win32 были изменены с UCS-2 на UTF-16 некоторое время go, см. Статью "Unicode в Microsoft Windows" в Википедии). Что меня удивило, так это то, что длина символьных объектов переменной длины UTF-16 должна оставаться неизменной, если символы были изменены на верхний или нижний регистр, потому что CharLower / UpperBuffW не изменяет длину буфера.

Так соответствует ли стандарт Unicode, что для языков со смешанным регистром два символа, совпадающие друг с другом, должны находиться в диапазоне символов, что приводит к кодированию символов одинаковой длины с UTF-16?

...