Возможно для некоторых символов.Наборы традиционных и упрощенных символов перекрываются, поэтому у вас есть в основном три набора символов:
- Только традиционные символы.
- Символы, которые только упрощены.Символы, которые остались нетронутыми и доступны в обоих.
Возьмите, например, символ 面.Он относится как к № 2, так и к № 3 ... Как упрощенный символ, он обозначает 面 и 麵 , лицо и лапшу.Принимая во внимание, что 麵 только традиционный характер.Таким образом, в базе данных Unihan, 麵 имеет kSimplifiedVariant
, что указывает на 面 .Таким образом, вы можете сделать вывод, что это только традиционный символ.
Но 面 также имеет kTraditionalVariant
, что указывает на 麵 .Вот где система ломается: если вы используете эти данные, чтобы вычесть, что 面 является только упрощенным символом, вы ошибаетесь ...
С другой стороны, 韩 имеетkTraditionalVariant
, указывая на 韓 , и эти две пары представляют собой "настоящую" упрощенную / традиционную пару.Но ничто в базе данных Unihan не отличает такие случаи, как 韓 / 韩, от случаев, подобных 麵 / 面.