Java Collator неожиданный вывод - PullRequest
0 голосов
/ 23 января 2019

Мне нужно сравнивать строки в моей программе без учета специальных национальных символов, например, «С» и «Ч» должны быть одинаковыми. Я использовал класс Collator. Для первого и второго случая это работает как ожидалось, но в третьем и четвертом случае нет.

пакетный подборщик;

import java.text.Collator;
import java.util.Locale;

public class Coll {

public static void main(String[] args) {
    Locale locale = new Locale("sk", "SK");
    Collator collator = Collator.getInstance(locale);
    collator.setStrength(Collator.PRIMARY);
    System.out.println(collator.compare("T", "Ť"));
    System.out.println(collator.compare("L", "Ľ"));
    System.out.println(collator.compare("C", "Č"));
    System.out.println(collator.compare("S", "Š"));
    }
}

Я ожидаю 0 0 0 0, но фактический результат равен 0 0 -1 -1

1 Ответ

0 голосов
/ 23 января 2019

Проверьте класс java.text.Normalizer. Я никогда не использовал это широко, но похоже, что это может быть полезно для вашей цели. Пример:

import java.text.Normalizer;
import java.text.Normalizer.Form;

public class NewClass2 {

    public static void main(String[] args) {

        System.out.println("T".compareTo( normalizeString("Ť") ));
        System.out.println("L".compareTo( normalizeString("Ľ") ));
        System.out.println("C".compareTo( normalizeString("Č") ));
        System.out.println("S".compareTo( normalizeString("Š") ));
        System.out.println("O".compareTo( normalizeString("Ö") ));
        System.out.println("U".compareTo( normalizeString("Ü") ));
        System.out.println("A".compareTo( normalizeString("Ä") ));
        System.out.println("A".compareTo( normalizeString("Å") ));        
    }

    public static String normalizeString(String str){
        return Normalizer.normalize(str, Form.NFD).replaceAll("[^\\p{ASCII}]", "");
    }
}

Прочтите этот блог для получения дополнительной информации: normalizing-text-in-java

...