Почему в NFD есть NFC;[: Марка без пробелов:] Удалить;NFC? - PullRequest
0 голосов
/ 22 февраля 2019

Вкл. http://userguide.icu -project.org / transforms / general Можно прочитать

, чтобы удалить акценты из символов, используйте следующее преобразование:

NFD; [:Nonspacing Mark:] Remove; NFC.

Это преобразование отделяет акценты от их базовых символов, удаляет акценты, а затем помещает оставшийся текст в безударную форму.

NFD выполняет каноническое разложение, так почему же нужно перекомпоновывать после удаления непропусковых меток?

1 Ответ

0 голосов
/ 25 февраля 2019

Хорошо, поэтому каноническое разложение не ограничивается диакритическими знаками;Мне был дан пример слогов хангыль, которые можно разбить на множество джамо.Тогда может иметь смысл перекомпоновать такие символы.

...