Несколько баллов:
(1) «Спецификация» не является символом. Спецификация - это последовательность байтов, которая появляется в начале файла, чтобы указать порядок байтов в файле, который закодирован в UTF-nn. Спецификация - это u '\ uFEFF'.encode (' UTF-nn '). Чтение файла с соответствующим кодеком приведет к снижению производительности; Вы не видите это как символ Юникода. Спецификация - это не данные. Если вы видите в ваших данных u '\ uFEFF', рассматривайте его как (устарелое) НУКРЫТЫЙ ПРОБЕЛ ZEROWIDTH.
(2) «минус кодовые точки Unicode-пробел, которые я адресую отдельно» ?? Разве NO-BREAK SPACE не является кодовой точкой "Unicode-white-space"?
(3) Ваш Питон, кажется, сломан; мой делает это:
>>> ord(unicodedata.lookup("NO-BREAK SPACE"))
160
(4) Вы можете использовать escape-последовательности для первых трех.
>>> map(hex, map(ord, "\t\v\f"))
['0x9', '0xb', '0xc']
(5) Вы можете использовать " "
для четвертого.
(6) Даже если бы вы могли использовать имена, читатели вашего кода все равно использовали бы слепую веру, например, «ФОРМА ПЕРЕДАЧИ» - это пробельный символ.
(7) Что случилось с \r
и \n
?