U + FB00 - символ совместимости.Обычно Unicode не поддерживает отдельные кодовые точки для лигатур (утверждая, что это решение макета, если и когда лигатура должна использоваться и не должна влиять на то, как хранятся данные). несколько из них все еще существуют, чтобы обеспечить совместимость преобразования в обоих направлениях со старыми кодировками, которые делают представляют лигатуры как отдельные объекты.
К счастью, информация, которая символизирует лигатурупредставляет , присутствует в файле данных Unicode , и большинство систем обработки строк имеют эти данные встроенными.
В Java вам необходимо использовать Normalizer
класс и NFKC
форма:
String ff ="\uFB00";
String normalized = Normalizer.normalize(ff, Form.NFKC);
System.out.println(ff + " = " + normalized);
Это напечатает
ff = ff