Какие наборы символов требуют более 16 бит на символ? - PullRequest
0 голосов
/ 09 октября 2018

Существуют ли какие-либо наборы символов, кроме Юникода, для которых требуется более 16 бит для некоторых кодовых точек в их репертуаре символов?Т.е. где максимальная кодовая точка символа больше 65535.

Я не ищу символы кодировки , где схема упаковки байтов вызывает кодовую точку, которая в противном случае соответствовала бы16 бит, чтобы занять больше битов в строке.Я просто хочу предоставить способ хранить один «устаревший» индекс символа в одном машинном слове.Осталось мало места, и я хотел бы знать, следует ли мне принять специальные меры, чтобы зарезервировать более 16 битов для любого конкретного набора символов (кроме Unicode).Я не так ограничен в пространстве со строками, так что вполне нормально, чтобы символ кодировки превышал 16 бит (два байта) на кодовую точку.

Другая причина, по которой я спрашиваю, - простое любопытство,Мне всегда было интересно, приходилось ли когда-либо использовать какую-либо систему более чем на 16 бит до появления Unicode.

код TRON - единственный, который я нашел до сих пор, и это объединениедругие наборы символов (например, Unicode, но без объединения Han).Согласно Википедии, она поддерживает 150 миллионов кодовых точек.

Эта страница о кодировках японского языка указывает на то, что некоторые кодировки JIS X имеют три байта, но я не могу понять, имеют ли они в виду только кодировкиили имеют ли некоторые наборы символов JIS X также кодовые точки, превышающие 65535.

...