Дублировать кодовые точки для символьных элементов CJK? - PullRequest
1 голос
/ 04 апреля 2019

Unicode имеет кодовые точки для символьных элементов CJK (иногда называемых «радикалами», хотя и отличными от 214 канонических / Kangxi радикалов).

Некоторые из них существуют в двух местах, как две разные кодовые точки. Они выглядят одинаково или почти одинаково в шрифтах, которые я вижу. Как так? Какая там история?

Например:

  • U + 4E5A 乚 и U + 2E83 ⺃
  • U + 20628 ? и U + 2E87 ⺇
  • U + 5202 刂 и U + 2E89 ⺉
  • U + 5FC4 忄 и U + 2E96 ⺖

Для первого также есть U + 31DF ㇟ - это в диапазоне для одиночных ударов CJK.

Специально для них есть специальный диапазон «Дополнение радикалов CJK» в 2E80-2EF4, но большинство из них можно найти и в других местах Юникода.

И эти кодовые точки вне диапазона дополнения к радикалам не являются символами, состоящими из одного элемента. Форма не оставляет сомнений - они имели в виду именно сам элемент.

...