У меня есть строка:
var text = @"
I have a long string with a load of words,
and it includes new lines and non-letter characters.
I want to remove all of them and split this text to have one word per line, then I can count how many of each word exist."
Как лучше всего удалить все не-буквенные символы, а затем разбить каждое слово на новую строку, чтобы я мог сохранить и посчитать, сколько из каждогослово есть?
var words = text.Split(' ');
foreach(var word in words)
{
word.Trim(',','.','-');
}
Я пробовал разные вещи, такие как text.Replace(characters)
с whitespace
, а затем разделить. Я пробовал Regex (который я бы не использовал).
Я также пытался использовать класс StringBuilder для извлечения символов из текста (строки) и добавления символа только в том случае, если это буква az /AZ.
Также попытался вызвать sb.Replace или sb.Удалите символы, которые я не хочу, прежде чем сохранять их в Словаре. Но я все еще, кажется, получаю символы, которые мне не нужны?
Все, что я пытаюсь, кажется, у меня есть хотя бы один персонаж, которого я не хочу, и не могу понять, почему это не так. не работает
Спасибо!