Есть ли эквивалент в sscanf () в .NET? - PullRequest
15 голосов
/ 29 января 2009

.NET Framework предоставляет нам метод Формат :

string s = string.Format("This {0} very {1}.", "is", "funny");
// s is now: "This is very funny."

Мне нужна функция "Unformat", что-то вроде:

object[] params = string.Unformat("This {0} very {1}.", "This is very funny.");
// params is now: ["is", "funny"]

Я знаю, что нечто подобное существует в библиотеке ANSI-C ( printf vs scanf ).

Вопрос: есть ли что-то похожее в C #?

Обновление: захват групп с помощью регулярных выражений - это не то решение, которое мне нужно. Они также один из способов. Я ищу систему, которая может работать в обе стороны в одном формате. Можно отказаться от некоторых функций (таких как типы и информация о форматировании).

Ответы [ 8 ]

15 голосов
/ 29 января 2009

Нет такого метода, вероятно, из-за проблем, решающих неоднозначности:

string.Unformat("This {0} very {1}.", "This is very very funny.")
// are the parameters equal to "is" and "very funny", or "is very" and "funny"?

Регулярное выражение захват групп сделаны для этой проблемы; Вы можете посмотреть на них.

5 голосов
/ 25 февраля 2011

Если кому-то интересно, я только что опубликовал замену scanf() для .NET. Если регулярные выражения не совсем подходят вам, мой код очень близко следует строке формата scanf().

Вы можете посмотреть и скачать код, который я написал на http://www.blackbeltcoder.com/Articles/strings/a-sscanf-replacement-for-net.

4 голосов
/ 29 января 2009

регулярное выражение с группировкой?

/This (.*?) very (.*?)./
4 голосов
/ 29 января 2009

Вы можете сделать string [] parts = string.Split (''), а затем извлечь в вашем примере позиции индекса [1] и parts [3].

3 голосов
/ 29 января 2009

Да. Они называются "регулярными выражениями". Тот, кто будет делать это 1001 *

This (?<M0>.+) very (?<M1>.+)\.
1 голос
/ 20 мая 2009

Я сталкивался с той же проблемой, я полагаю, что есть решение Elegante, использующее REGEX ... но придумала функцию в C # для "UnFormat", которая работает довольно хорошо. Извините за отсутствие комментариев.

    /// <summary>
    /// Unformats a string using the original formating string. 
    /// 
    /// Tested Situations:
    ///    UnFormat("<nobr alt=\"1\">1<nobr>", "<nobr alt=\"{0}\">{0}<nobr>") : "1"
    ///    UnFormat("<b>2</b>", "<b>{0}</b>") : "2"
    ///    UnFormat("3<br/>", "{0}<br/>") : "3"
    ///    UnFormat("<br/>4", "<br/>{0}") : "4"
    ///    UnFormat("5", "") : "5"
    ///    UnFormat("<nobr>6<nobr>", "<nobr>{0}<nobr>") : "6"
    ///    UnFormat("<nobr>2009-10-02<nobr>", "<nobr>{0:yyyy-MM-dd}<nobr>") : "2009-10-02"
    ///    UnFormat("<nobr><nobr>", "<nobr>{0}<nobr>") : ""
    ///    UnFormat("bla", "<nobr>{0}<nobr>") : "bla"
    /// </summary>
    /// <param name="original"></param>
    /// <param name="formatString"></param>
    /// <returns>If an "unformat" is not possible the original string is returned.</returns>
    private Dictionary<int,string> UnFormat(string original, string formatString)
    {
       Dictionary<int, string> returnList = new Dictionary<int, string>();

       try{
          int index = -1;

          // Decomposes Format String
          List<string> formatDecomposed = new List<string> (formatString.Split('{'));
          for(int i = formatDecomposed.Count - 1; i >= 0; i--)
          {
             index = formatDecomposed[i].IndexOf('}') + 1;

             if (index > 0 && (formatDecomposed[i].Length - index) > 0)
             {
                formatDecomposed.Insert(i + 1, formatDecomposed[i].Substring(index, formatDecomposed[i].Length - index));
                formatDecomposed[i] = formatDecomposed[i].Substring(0, index);
             }
             else
                //Finished
                break;
          }

          // Finds and indexes format parameters
          index = 0;
          for (int i = 0; i < formatDecomposed.Count; i++)
          {
             if (formatDecomposed[i].IndexOf('}') < 0)
             {
                index += formatDecomposed[i].Length;
             }
             else
             {
                // Parameter Index
                int parameterIndex;
                if (formatDecomposed[i].IndexOf(':')< 0)
                   parameterIndex = Convert.ToInt16(formatDecomposed[i].Substring(0, formatDecomposed[i].IndexOf('}')));
                else
                   parameterIndex = Convert.ToInt16(formatDecomposed[i].Substring(0, formatDecomposed[i].IndexOf(':')));

                // Parameter Value
                if (returnList.ContainsKey(parameterIndex) == false)
                {
                   string parameterValue;

                   if (formatDecomposed.Count > i + 1)
                      if (original.Length > index)
                         parameterValue = original.Substring(index, original.IndexOf(formatDecomposed[i + 1], index) - index);
                      else
                         // Original String not valid
                         break;
                else
                   parameterValue = original.Substring(index, original.Length - index);

                returnList.Add(parameterIndex, parameterValue);
                index += parameterValue.Length;
             }
             else
                index += returnList[parameterIndex].Length;

             }
          }

          // Fail Safe #1
          if (returnList.Count == 0) returnList.Add(0, original);
       } 
       catch
       {
          // Fail Safe #2
          returnList = new Dictionary<int, string>();
          returnList.Add(0, original);
       }

       return returnList;
    }
1 голос
/ 29 января 2009

@ mquander: На самом деле, PHP решает это даже по-другому:

$s = "This is very very funny.";
$fmt = "This %s very %s.";
sscanf($s, $fmt, $one, $two);
echo "<div>one: [$one], two: [$two]</div>\n";
//echo's: "one: [is], two: [very]"

Но, возможно, ваше замечание по регулярному выражению может мне помочь. Мне просто нужно переписать "This {0} very {1}." что-то вроде: new Regex(@"^This (.*) very (.*)\.$"). Это должно быть сделано программно, поэтому я могу использовать одну строку формата в интерфейсе открытого класса.

Кстати: у меня уже есть парсер для поиска параметров: см. Запись в блоге Именованный формат Redux от Фил Хаак (и да, я также хочу, чтобы именованные параметры работали в обе стороны).

0 голосов
/ 13 мая 2016

Я ссылаюсь на предыдущий ответ, написал образец см. Следующий

string sampleinput = "FirstWord.22222";

Match match = Regex.Match(sampleinput, @"(\w+)\.(\d+)$", RegexOptions.IgnoreCase);

if(match.Success){

string totalmatchstring = match.Groups[0]; // FirstWord.22222
string firstpart = match.Groups[1]; // FirstWord`
string secondpart = match.Groups[2]; // 22222

}

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...