Вкл. http://userguide.icu -project.org / transforms / general Можно прочитать
, чтобы удалить акценты из символов, используйте следующее преобразование: NFD; [:Nonspacing Mark:] Remove; NFC. Это преобразование отделяет акценты от их базовых символов, удаляет акценты, а затем помещает оставшийся текст в безударную форму.
, чтобы удалить акценты из символов, используйте следующее преобразование:
NFD; [:Nonspacing Mark:] Remove; NFC.
NFD; [:Nonspacing Mark:] Remove; NFC
Это преобразование отделяет акценты от их базовых символов, удаляет акценты, а затем помещает оставшийся текст в безударную форму.
NFD выполняет каноническое разложение, так почему же нужно перекомпоновывать после удаления непропусковых меток?
NFD
Хорошо, поэтому каноническое разложение не ограничивается диакритическими знаками;Мне был дан пример слогов хангыль, которые можно разбить на множество джамо.Тогда может иметь смысл перекомпоновать такие символы.