Как удалить из строки все не алфавитно-цифровые символы, кроме тире? - PullRequest
541 голосов
/ 09 июля 2010

Как удалить из строки все не алфавитно-цифровые символы, кроме тире и пробелов?

Ответы [ 12 ]

779 голосов
/ 09 июля 2010

Заменить [^a-zA-Z0-9 -] пустой строкой.

Regex rgx = new Regex("[^a-zA-Z0-9 -]");
str = rgx.Replace(str, "");
334 голосов
/ 09 июля 2010

Я мог бы использовать RegEx, они могут предоставить элегантное решение, но они могут вызвать проблемы с производительностью.Вот одно из решений

char[] arr = str.ToCharArray();

arr = Array.FindAll<char>(arr, (c => (char.IsLetterOrDigit(c) 
                                  || char.IsWhiteSpace(c) 
                                  || c == '-')));
str = new string(arr);

При использовании компактной платформы (в которой нет FindAll)

Замените FindAll на 1

char[] arr = str.Where(c => (char.IsLetterOrDigit(c) || 
                             char.IsWhiteSpace(c) || 
                             c == '-')).ToArray(); 

str = new string(arr);

1 Комментарий ShawnFeatherly

42 голосов
/ 09 июля 2010

Вы можете попробовать:

   string s1= Regex.Replace(s,"[^A-Za-z0-9 _]","");

Где s - ваша строка.

33 голосов
/ 01 марта 2013

Использование System.Linq

string withOutSpecialCharacters = new string(stringWithSpecialCharacters.Where(c =>char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-').ToArray());
21 голосов
/ 09 июля 2010

регулярное выражение [^\w\s\-]*:

\s лучше использовать вместо пробела (), поскольку в тексте может быть вкладка.

12 голосов
/ 26 ноября 2015

Основываясь на ответе на этот вопрос, я создал статический класс и добавил их.Я подумал, что это может быть полезно для некоторых людей.

public static class RegexConvert
{
    public static string ToAlphaNumericOnly(this string input)
    {
        Regex rgx = new Regex("[^a-zA-Z0-9]");
        return rgx.Replace(input, "");
    }

    public static string ToAlphaOnly(this string input)
    {
        Regex rgx = new Regex("[^a-zA-Z]");
        return rgx.Replace(input, "");
    }

    public static string ToNumericOnly(this string input)
    {
        Regex rgx = new Regex("[^0-9]");
        return rgx.Replace(input, "");
    }
}

Тогда методы можно использовать как:

string example = "asdf1234!@#$";
string alphanumeric = example.ToAlphaNumericOnly();
string alpha = example.ToAlphaOnly();
string numeric = example.ToNumericOnly();
4 голосов
/ 31 октября 2013

Я принял другое решение, исключив символы Control , что было моей первоначальной проблемой.

Это лучше, чем вносить в список все «особые, но хорошие»chars

char[] arr = str.Where(c => !char.IsControl(c)).ToArray();    
str = new string(arr);

это проще, так что я думаю, что лучше!

3 голосов
/ 16 августа 2016

Хотите что-нибудь быстрое?

public static class StringExtensions 
{
    public static string ToAlphaNumeric(this string self, params char[] allowedCharacters)
    {
        return new string(Array.FindAll(self.ToCharArray(), c => char.IsLetterOrDigit(c) || allowedCharacters.Contains(c)));
    }
}

Это позволит вам указать, какие символы вы также хотите разрешить.

2 голосов
/ 26 января 2018

Вот быстрое решение без выделения регулярных выражений, которое я искал.

Небезопасное издание.

public static unsafe void ToAlphaNumeric(ref string input)
{
    fixed (char* p = input)
    {
        int offset = 0;
        for (int i = 0; i < input.Length; i++)
        {
            if (char.IsLetterOrDigit(p[i]))
            {
                p[offset] = input[i];
                offset++;
            }
        }
        ((int*)p)[-1] = offset; // Changes the length of the string
        p[offset] = '\0';
    }
}

И для тех, кто не хочет использоватьнебезопасен или не доверяет взлому длины строки.

public static string ToAlphaNumeric(string input)
{
    int j = 0;
    char[] newCharArr = new char[input.Length];

    for (int i = 0; i < input.Length; i++)
    {
        if (char.IsLetterOrDigit(input[i]))
        {
            newCharArr[j] = input[i];
            j++;
        }
    }

    Array.Resize(ref newCharArr, j);

    return new string(newCharArr);
}
1 голос
/ 08 ноября 2018

Вот метод расширения, использующий @ ata ответ в качестве вдохновения.

"hello-world123, 456".MakeAlphaNumeric(new char[]{'-'});// yields "hello-world123456"

или если вам требуются дополнительные символы, кроме дефиса ...

"hello-world123, 456!?".MakeAlphaNumeric(new char[]{'-','!'});// yields "hello-world123456!"


public static class StringExtensions
{   
    public static string MakeAlphaNumeric(this string input, params char[] exceptions)
    {
        var charArray = input.ToCharArray();
        var alphaNumeric = Array.FindAll<char>(charArray, (c => char.IsLetterOrDigit(c)|| exceptions?.Contains(c) == true));
        return new string(alphaNumeric);
    }
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...