Как заменить символы в строке Java? - PullRequest
6 голосов
/ 16 апреля 2010

Мне нравится эффективно заменять определенный набор символов строки соответствующим символом замены.

Например:

String sourceCharacters = "šđćčŠĐĆČžŽ";
String targetCharacters = "sdccSDCCzZ";

String result = replaceChars("Gračišće", sourceCharacters , targetCharacters );

Assert.equals(result,"Gracisce") == true;

Есть ли более эффективный способ, чем использовать метод replaceAll класса String?

Моя первая идея была:

final String s = "Gračišće";
String sourceCharacters = "šđćčŠĐĆČžŽ";
String targetCharacters = "sdccSDCCzZ";

// preparation
final char[] sourceString = s.toCharArray();
final char result[] = new char[sourceString.length];
final char[] targetCharactersArray = targetCharacters.toCharArray();

// main work
for(int i=0,l=sourceString.length;i<l;++i)
{
  final int pos = sourceCharacters.indexOf(sourceString[i]);
  result[i] = pos!=-1 ? targetCharactersArray[pos] : sourceString[i];
}

// result
String resultString = new String(result);

Есть идеи?

Кстати, символы UTF-8 вызывают проблемы, с US_ASCII все работает нормально.

Ответы [ 2 ]

14 голосов
/ 16 апреля 2010

Вы можете использовать java.text.Normalizer и порцию регулярных выражений, чтобы избавиться от диакритических знаков , которых существует на много больше, чем вы собрали как далеко.

Вот SSCCE , скопируйте и вставьте его на Java 6:

package com.stackoverflow.q2653739;

import java.text.Normalizer;
import java.text.Normalizer.Form;

public class Test {

    public static void main(String... args) {
        System.out.println(removeDiacriticalMarks("Gračišće"));
    }

    public static String removeDiacriticalMarks(String string) {
        return Normalizer.normalize(string, Form.NFD)
            .replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
    }
}

Это должно дать

Gracisce

По крайней мере, здесь, в Eclipse, кодировка символов консоли установлена ​​в UTF-8 ( Окно> Настройки> Общие> Рабочая область> Кодировка текстовых файлов ). Убедитесь, что то же самое установлено и в вашей среде.

В качестве альтернативы можно сохранить Map<Character, Character>:

Map<Character, Character> charReplacementMap = new HashMap<Character, Character>();
charReplacementMap.put('š', 's');
charReplacementMap.put('đ', 'd');
// Put more here.

String originalString = "Gračišće";
StringBuilder builder = new StringBuilder();

for (char currentChar : originalString.toCharArray()) {
    Character replacementChar = charReplacementMap.get(currentChar);
    builder.append(replacementChar != null ? replacementChar : currentChar);
}

String newString = builder.toString();
0 голосов
/ 16 апреля 2010

Я бы использовал метод replace в простом цикле.

String sourceCharacters = "šđćčŠĐĆČžŽ";
String targetCharacters = "sdccSDCCzZ";

String s = "Gračišće";
for (int i=0 ; i<sourceCharacters.length() ; i++)
    s = s.replace(sourceCharacters.charAt[i], targetCharacters.charAt[i]);

System.out.println(s);
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...