Замена всех не алфавитно-цифровых символов на пустые строки - PullRequest
179 голосов
/ 26 ноября 2009

Я пытался использовать это, но не сработало-

return value.replaceAll("/[^A-Za-z0-9 ]/", "");

Ответы [ 12 ]

224 голосов
/ 26 ноября 2009

Используйте [^A-Za-z0-9].

Примечание. Пробел удален, поскольку обычно он не считается буквенно-цифровым.

120 голосов
/ 26 ноября 2009

Попробуйте

return value.replaceAll("[^A-Za-z0-9]", "");

или

return value.replaceAll("[\\W]|_", "");
52 голосов
/ 17 сентября 2015

Вы должны знать, что [^a-zA-Z] заменит символы, не являющиеся самими собой в диапазоне символов A-Z / a-z. Это означает, что специальные символы, такие как é, ß и т. Д., Или символы кириллицы, и такие будут удалены.

Если замена этих символов нежелательна, используйте вместо этого предопределенные классы символов:

 someString.replaceAll("[^\\p{IsAlphabetic}^\\p{IsDigit}]", "");

PS: \p{Alnum} не достигает этого эффекта, действует так же, как [A-Za-z0-9].

48 голосов
/ 26 ноября 2009
return value.replaceAll("[^A-Za-z0-9 ]", "");

Это оставит пробелов без изменений. Я полагаю, это то, что вы хотите. В противном случае удалите пробел из регулярного выражения.

21 голосов
/ 06 августа 2013

Вы также можете попробовать это более простое регулярное выражение:

 str = str.replaceAll("\\P{Alnum}", "");
10 голосов
/ 26 ноября 2009

Регулярные выражения Java не требуют от вас ставить косую черту (/) или любой другой разделитель в регулярном выражении, в отличие от других языков, таких как, например, Perl.

8 голосов
/ 27 ноября 2009

Я сделал этот метод для создания имен файлов:

public static String safeChar(String input)
{
    char[] allowed = "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ-_".toCharArray();
    char[] charArray = input.toString().toCharArray();
    StringBuilder result = new StringBuilder();
    for (char c : charArray)
    {
        for (char a : allowed)
        {
            if(c==a) result.append(a);
        }
    }
    return result.toString();
}
3 голосов
/ 21 ноября 2018

Решение:

value.replaceAll("[^A-Za-z0-9]", "")

Пояснение:

[^abc] Когда каретка ^ появляется в качестве первого символа в квадратных скобках, она отменяет шаблон. Этот шаблон соответствует любому символу, кроме a или b или c.

Глядя на ключевое слово как две функции:

  • [(Pattern)] = match(Pattern)
  • [^(Pattern)] = notMatch(Pattern)

Более того, относительно шаблона:

  • A-Z = all characters included from A to Z

  • a-z = all characters included from a to z

  • 0=9 = all characters included from 0 to 9

Поэтому он заменит все символы, НЕ включенные в шаблон

1 голос
/ 04 октября 2018

Используя Guava, вы можете легко комбинировать различные типы критериев. Для вашего конкретного решения вы можете использовать:

value = CharMatcher.inRange('0', '9')
        .or(CharMatcher.inRange('a', 'z')
        .or(CharMatcher.inRange('A', 'Z'))).retainFrom(value)
1 голос
/ 24 мая 2018

Если вы хотите также разрешить алфавитно-цифровые символы, которые не относятся к набору символов ascii, как, например, немецкие умлауты, вы можете использовать следующее решение:

 String value = "your value";

 // this could be placed as a static final constant, so the compiling is only done once
 Pattern pattern = Pattern.compile("[^\\w]", Pattern.UNICODE_CHARACTER_CLASS);

 value = pattern.matcher(value).replaceAll("");

Обратите внимание, что использование флага UNICODE_CHARACTER_CLASS может привести к снижению производительности (см. Javadoc этого флага)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...