Индекс максимальной кодовой точки Unicode - PullRequest
0 голосов
/ 26 июня 2018
>>> i = 0
... while True:
...     try:
...         chr(i)
...     except ValueError:
...         print(i)
...         break
...     i += 1
...         
1114112

Этот номер где-то в stdlib? На данный момент я анализирую его с chr.__doc__ (unichr.__doc__ на Python 2), который кажется хромым.

Допустимый диапазон для аргумента зависит от конфигурации Python - это может быть UCS2 [0..0xFFFF] или UCS4 [0..0x10FFFF]. Я не уверен, возможны ли другие диапазоны.

1 Ответ

0 голосов
/ 26 июня 2018

Это sys.maxunicode:

Целое число, дающее значение наибольшей кодовой точки Unicode, то есть 1114111 (0x10FFFF в шестнадцатеричном формате).

Изменено в версии 3.3: До PEP 393, sys.maxunicode был либо 0xFFFF, либо 0x10FFFF, в зависимости от параметра конфигурации, определяющего, были ли символы Unicode сохранены как UCS-2 или UCS-4.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...