Преобразование e + «КОМБИНИРОВАНИЕ ОСТРОГО АКЦЕНТА» в é в Java - PullRequest
0 голосов
/ 09 февраля 2020

Существует 2 способа представления é в юникоде:

  • 2 точки юникода: e + ́ (= нормальное e + "в сочетании с острым акцентом")
  • 1 точка юникода : é (= e с острым акцентом)

Как я могу убедиться, что строка Java, содержащая оба типа, преобразуется в строку, содержащую только одну версию точки Unicode?

1 Ответ

2 голосов
/ 09 февраля 2020

Вы можете использовать java.text.Normalizer, как описано в Нормализующий текст учебник . В вашем случае вы, вероятно, искали бы форму нормализации C (хотя, в зависимости от конкретной ситуации, вам может потребоваться форма нормализации K C, но обычно NF C - это то, что вам нужно; см. Учебное пособие детали).

normalizedString = Normalizer.normalize(originalString, Normalizer.Form.NFC);
...