Я хочу удалить все шумовые теги из входных тегов (строки). Теги разделяются запятой.Если шумовое слово является частью большого тега, оно останется.
Это то, что у меня есть, но я не работаю:
string input_string = "This,sure,about,all of our, all, values";
string stopWords = "this|is|about|after|all|also";
stopWords = string.Format(@"\s?\b(?:{0})\b\s?", stopWords);
string tags = Regex.Replace(input_string, stopWords, "", RegexOptions.IgnoreCase);
Это то, что я хочу сверху, введите: ",Обязательно ,, все наши ,, значения "
Эти слова" This "," about "," all "будут заменены на" ", поскольку они являются шумовыми словами.Но «все наше» останется, даже если в нем есть шумовое слово «все».Это потому, что запятая является границей тега
Кто-нибудь может мне помочь?
У меня было альтернативное решение, которое помещает слова с помехами в словарь и затем ищет каждое слово во входной строке.Но я предпочитаю подход RegEx.