Unicode имеет кодовые точки для символьных элементов CJK (иногда называемых «радикалами», хотя и отличными от 214 канонических / Kangxi радикалов).
Некоторые из них существуют в двух местах, как две разные кодовые точки. Они выглядят одинаково или почти одинаково в шрифтах, которые я вижу. Как так? Какая там история?
Например:
- U + 4E5A 乚 и U + 2E83 ⺃
- U + 20628 ? и U + 2E87 ⺇
- U + 5202 刂 и U + 2E89 ⺉
- U + 5FC4 忄 и U + 2E96 ⺖
Для первого также есть U + 31DF ㇟ - это в диапазоне для одиночных ударов CJK.
Специально для них есть специальный диапазон «Дополнение радикалов CJK» в 2E80-2EF4, но большинство из них можно найти и в других местах Юникода.
И эти кодовые точки вне диапазона дополнения к радикалам не являются символами, состоящими из одного элемента. Форма не оставляет сомнений - они имели в виду именно сам элемент.