Как заменить список строк в тексте на элементы из другого списка? - PullRequest
0 голосов
/ 27 октября 2019

Предположим, у меня есть список строк {"boy", "car", "ball"} и текст "мальчик продал свою машину, чтобы купить мяч".

Учитывая другой список строк {"dog "," bar "," bone "}, моя цель - найти все вхождения первого списка в тексте и заменить их на строки второго списка:

BEFORE: the [boy] sold his [car] to buy a [ball]
AFTER:  the [dog] sold his [bar] to buy a [bone]

Моя первая мысль былаиспользовать Regex, но я не знаю, как связать список строк в регулярное выражение, и я не хочу писать Aho-Corasick.

Какой правильный путь для этого?


Другой пример:

Text: aaa bbb abab aabb bbaa ubab
replacing {aa, bb, ab, ub} for {11, 22, 35, &x}

BEFORE: [aa]a [bb]b [ab][ab] [aa][bb] [bb][aa] [ub][ab]
AFTER:  [11]a [22]b [35][35] [11][22] [22][11] [&x][35]

Ответы [ 2 ]

3 голосов
/ 27 октября 2019

Если вы хотите использовать регулярные выражения, вы можете использовать что-то вроде этого:

var findList = new List<string>() { "boy", "car", "ball" };
var replaceList = new List<string>() { "dog", "bar", "bone" };

// Create a dictionary from the lists or have a dictionary from the beginning.
var dictKeywords = findList.Select((s, i) => new { s, i })
                           .ToDictionary(x => x.s, x => replaceList[x.i]);

string input = "the boy sold his car to buy a ball";
// Construct the regex pattern by joining the dictionary keys with an 'OR' operator.
string pattern = string.Join("|", dictKeywords.Keys.Select(s => Regex.Escape(s)));

string output =
    Regex.Replace(input, pattern, delegate (Match m)
    {
        string replacement;
        if (dictKeywords.TryGetValue(m.Value, out replacement)) return replacement;
        return m.Value;
    });

Console.WriteLine(output);

Вывод:

собака продала свой бар, чтобы купить кость

2 голосов
/ 27 октября 2019

Нет необходимости использовать Regex, string.Replace будет достаточно

var input = "the boy sold his car to buy a ball";
var oldvalues = new List<string>() { "boy", "car", "ball" };
var newValues = new List<string>() { "dog", "bar", "bone" };
var output = input;
for (int i = 0; i < oldvalues.Count; i++)
{
    output = output.Replace(oldvalues[i], newValues[i]);
}
Console.WriteLine(output);
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...