Разделить строку разделителями, но в результате оставить разделители в C # - PullRequest
19 голосов
/ 13 января 2011

Я бы хотел разделить строку разделителями, но в результате оставить разделители.

Как бы я это сделал в C #?

Ответы [ 7 ]

21 голосов
/ 13 января 2011

Если вы хотите, чтобы разделитель был «собственным разделением», вы можете использовать Regex.Split например:

string input = "plum-pear";
string pattern = "(-)";

string[] substrings = Regex.Split(input, pattern);    // Split on hyphens
foreach (string match in substrings)
{
   Console.WriteLine("'{0}'", match);
}
// The method writes the following to the console:
//    'plum'
//    '-'
//    'pear'
4 голосов
/ 05 февраля 2015

Эта версия не использует LINQ или Regex, поэтому, вероятно, она относительно эффективна. Я думаю, что это может быть проще в использовании, чем Regex, потому что вам не нужно беспокоиться о экранировании специальных разделителей. Он возвращает IList<string>, что более эффективно, чем всегда преобразование в массив. Это метод расширения, который удобен. Вы можете передавать разделители как массив или как несколько параметров.

/// <summary>
/// Splits the given string into a list of substrings, while outputting the splitting
/// delimiters (each in its own string) as well. It's just like String.Split() except
/// the delimiters are preserved. No empty strings are output.</summary>
/// <param name="s">String to parse. Can be null or empty.</param>
/// <param name="delimiters">The delimiting characters. Can be an empty array.</param>
/// <returns></returns>
public static IList<string> SplitAndKeepDelimiters(this string s, params char[] delimiters)
{
    var parts = new List<string>();
    if (!string.IsNullOrEmpty(s))
    {
        int iFirst = 0;
        do
        {
            int iLast = s.IndexOfAny(delimiters, iFirst);
            if (iLast >= 0)
            {
                if (iLast > iFirst)
                    parts.Add(s.Substring(iFirst, iLast - iFirst)); //part before the delimiter
                parts.Add(new string(s[iLast], 1));//the delimiter
                iFirst = iLast + 1;
                continue;
            }

            //No delimiters were found, but at least one character remains. Add the rest and stop.
            parts.Add(s.Substring(iFirst, s.Length - iFirst));
            break;

        } while (iFirst < s.Length);
    }

    return parts;
}

Некоторые юнит-тесты:

text = "[a link|http://www.google.com]";
result = text.SplitAndKeepDelimiters('[', '|', ']');
Assert.IsTrue(result.Count == 5);
Assert.AreEqual(result[0], "[");
Assert.AreEqual(result[1], "a link");
Assert.AreEqual(result[2], "|");
Assert.AreEqual(result[3], "http://www.google.com");
Assert.AreEqual(result[4], "]");
2 голосов
/ 13 января 2011

Я бы сказал, что самый простой способ сделать это (за исключением аргумента, приведенного Хансом Кестингом) - это разделить строку обычным способом, затем выполнить итерацию по массиву и добавить разделитель для каждого элемента, кроме последнего. *

0 голосов
/ 09 ноября 2018

Я записал этот код в split и оставил разделители :

private static string[] SplitKeepDelimiters(string toSplit, char[] delimiters, StringSplitOptions splitOptions = StringSplitOptions.None)
{
    var tokens = new List<string>();
    int idx = 0;
    for (int i = 0; i < toSplit.Length; ++i)
    {
        if (delimiters.Contains(toSplit[i]))
        {
            tokens.Add(toSplit.Substring(idx, i - idx));  // token found
            tokens.Add(toSplit[i].ToString());            // delimiter
            idx = i + 1;                                  // start idx for the next token
        }
    }

    // last token
    tokens.Add(toSplit.Substring(idx));

    if (splitOptions == StringSplitOptions.RemoveEmptyEntries)
    {
        tokens = tokens.Where(token => token.Length > 0).ToList();
    }

    return tokens.ToArray();
}

Использование пример:

string toSplit = "AAA,BBB,CCC;DD;,EE,";
char[] delimiters = new char[] {',', ';'};
string[] tokens = SplitKeepDelimiters(toSplit, delimiters, StringSplitOptions.RemoveEmptyEntries);
foreach (var token in tokens)
{
    Console.WriteLine(token);
}
0 голосов
/ 15 августа 2015

Чтобы избежать добавления символа в новую строку, попробуйте это:

 string[] substrings = Regex.Split(input,@"(?<=[-])");
0 голосов
/ 15 февраля 2014

Я столкнулся с той же проблемой, но с несколькими разделителями. Вот мое решение:

    public static string[] SplitLeft(this string @this, char[] delimiters, int count)
    {
        var splits = new List<string>();
        int next = -1;
        while (splits.Count + 1 < count && (next = @this.IndexOfAny(delimiters, next + 1)) >= 0)
        {
            splits.Add(@this.Substring(0, next));
            @this = new string(@this.Skip(next).ToArray());
        }
        splits.Add(@this);
        return splits.ToArray();
    }

Пример с разделением имен переменных CamelCase:

var variableSplit = variableName.SplitLeft(
    Enumerable.Range('A', 26).Select(i => (char)i).ToArray());
0 голосов
/ 04 февраля 2014

Я хотел сделать многострочную строку, как это, но мне нужно было сохранить разрывы строк, поэтому я сделал это

string x = 
@"line 1 {0}
line 2 {1}
";

foreach(var line in string.Format(x, "one", "two")
    .Split("\n") 
    .Select(x => x.Contains('\r') ? x + '\n' : x)
    .AsEnumerable()
) {
    Console.Write(line);
}

приводит к

line 1 one
line 2 two
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...