Как кодировать строки для регулярных выражений в .NET? - PullRequest
6 голосов
/ 25 июля 2010

Мне нужно динамически построить регулярное выражение, чтобы поймать заданные ключевые слова, как

string regex = "(some|predefined|words";
foreach (Product product in products)
    regex += "|" + product.Name; // Need to encode product.Name because it can include special characters.
regex += ")";

Есть ли какой-нибудь код Regex.Encode, который делает это?

1 Ответ

8 голосов
/ 25 июля 2010

Вы можете использовать Regex.Escape. Например:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;

public class Test
{
    static void Main()
    {
        string[] predefined = { "some", "predefined", "words" };
        string[] products = { ".NET", "C#", "C# (2)" };

        IEnumerable<string> escapedKeywords = 
            predefined.Concat(products)
                      .Select(Regex.Escape);
        Regex regex = new Regex("(" + string.Join("|", escapedKeywords) + ")");
        Console.WriteLine(regex);
    }
}

Выход:

(some|predefined|words|\.NET|C\#|C\#\ \(2\))

Или без LINQ, но с использованием конкатенации строк в цикле (чего я стараюсь избегать) согласно исходному коду:

string regex = "(some|predefined|words";
foreach (Product product)
    regex += "|" + Regex.Escape(product.Name);
regex += ")";
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...