Могу ли я преобразовать строковое значение C # в экранированный строковый литерал - PullRequest
174 голосов
/ 27 ноября 2008

Могу ли я преобразовать строковое значение в строковый литерал в C # так, как я вижу его в коде? Я хотел бы заменить вкладки, новые строки и т. Д. На их escape-последовательности.

Если этот код:

Console.WriteLine(someString);

производит:

Hello
World!

Я хочу этот код:

Console.WriteLine(ToLiteral(someString));

произвести:

\tHello\r\n\tWorld!\r\n

Ответы [ 15 ]

159 голосов
/ 28 ноября 2008

Я нашел это:

private static string ToLiteral(string input)
{
    using (var writer = new StringWriter())
    {
        using (var provider = CodeDomProvider.CreateProvider("CSharp"))
        {
            provider.GenerateCodeFromExpression(new CodePrimitiveExpression(input), writer, null);
            return writer.ToString();
        }
    }
}

Этот код:

var input = "\tHello\r\n\tWorld!";
Console.WriteLine(input);
Console.WriteLine(ToLiteral(input));

Производит:

    Hello
    World!
"\tHello\r\n\tWorld!"
32 голосов
/ 16 января 2013

А как насчет Regex.Escape (String) ?

Regex.Escape экранирует минимальный набор символов (\, *, +,?, |, {, [, (,), ^, $,., # и пробел), заменив их на escape коды.

23 голосов
/ 27 ноября 2008

EDIT: более структурированный подход, включая все escape-последовательности для string s и char s.
Не заменяет символы Юникода их буквальным эквивалентом. Яйца тоже не готовит.

public class ReplaceString
{
    static readonly IDictionary<string, string> m_replaceDict 
        = new Dictionary<string, string>();

    const string ms_regexEscapes = @"[\a\b\f\n\r\t\v\\""]";

    public static string StringLiteral(string i_string)
    {
        return Regex.Replace(i_string, ms_regexEscapes, match);
    }

    public static string CharLiteral(char c)
    {
        return c == '\'' ? @"'\''" : string.Format("'{0}'", c);
    }

    private static string match(Match m)
    {
        string match = m.ToString();
        if (m_replaceDict.ContainsKey(match))
        {
            return m_replaceDict[match];
        }

        throw new NotSupportedException();
    }

    static ReplaceString()
    {
        m_replaceDict.Add("\a", @"\a");
        m_replaceDict.Add("\b", @"\b");
        m_replaceDict.Add("\f", @"\f");
        m_replaceDict.Add("\n", @"\n");
        m_replaceDict.Add("\r", @"\r");
        m_replaceDict.Add("\t", @"\t");
        m_replaceDict.Add("\v", @"\v");

        m_replaceDict.Add("\\", @"\\");
        m_replaceDict.Add("\0", @"\0");

        //The SO parser gets fooled by the verbatim version 
        //of the string to replace - @"\"""
        //so use the 'regular' version
        m_replaceDict.Add("\"", "\\\""); 
    }

    static void Main(string[] args){

        string s = "here's a \"\n\tstring\" to test";
        Console.WriteLine(ReplaceString.StringLiteral(s));
        Console.WriteLine(ReplaceString.CharLiteral('c'));
        Console.WriteLine(ReplaceString.CharLiteral('\''));

    }
}
18 голосов
/ 27 ноября 2008
public static class StringHelpers
{
    private static Dictionary<string, string> escapeMapping = new Dictionary<string, string>()
    {
        {"\"", @"\\\"""},
        {"\\\\", @"\\"},
        {"\a", @"\a"},
        {"\b", @"\b"},
        {"\f", @"\f"},
        {"\n", @"\n"},
        {"\r", @"\r"},
        {"\t", @"\t"},
        {"\v", @"\v"},
        {"\0", @"\0"},
    };

    private static Regex escapeRegex = new Regex(string.Join("|", escapeMapping.Keys.ToArray()));

    public static string Escape(this string s)
    {
        return escapeRegex.Replace(s, EscapeMatchEval);
    }

    private static string EscapeMatchEval(Match m)
    {
        if (escapeMapping.ContainsKey(m.Value))
        {
            return escapeMapping[m.Value];
        }
        return escapeMapping[Regex.Escape(m.Value)];
    }
}
15 голосов
/ 02 марта 2012

попробовать:

var t = HttpUtility.JavaScriptStringEncode(s);
13 голосов
/ 06 февраля 2013

Ответ Халлгрима превосходен, но дополнения "+", перевод строки и отступа нарушали мою функциональность. Простой способ обойти это:

private static string ToLiteral(string input)
{
    using (var writer = new StringWriter())
    {
        using (var provider = CodeDomProvider.CreateProvider("CSharp"))
        {
            provider.GenerateCodeFromExpression(new CodePrimitiveExpression(input), writer, new CodeGeneratorOptions {IndentString = "\t"});
            var literal = writer.ToString();
            literal = literal.Replace(string.Format("\" +{0}\t\"", Environment.NewLine), "");
            return literal;
        }
    }
}
12 голосов
/ 30 декабря 2012

Полностью рабочая реализация, включая экранирование Unicode и ASCII непечатаемых символов. Не содержит знаков «+», таких как ответ Халлгрима .

    static string ToLiteral(string input) {
        StringBuilder literal = new StringBuilder(input.Length + 2);
        literal.Append("\"");
        foreach (var c in input) {
            switch (c) {
                case '\'': literal.Append(@"\'"); break;
                case '\"': literal.Append("\\\""); break;
                case '\\': literal.Append(@"\\"); break;
                case '\0': literal.Append(@"\0"); break;
                case '\a': literal.Append(@"\a"); break;
                case '\b': literal.Append(@"\b"); break;
                case '\f': literal.Append(@"\f"); break;
                case '\n': literal.Append(@"\n"); break;
                case '\r': literal.Append(@"\r"); break;
                case '\t': literal.Append(@"\t"); break;
                case '\v': literal.Append(@"\v"); break;
                default:
                    // ASCII printable character
                    if (c >= 0x20 && c <= 0x7e) {
                        literal.Append(c);
                    // As UTF16 escaped character
                    } else {
                        literal.Append(@"\u");
                        literal.Append(((int)c).ToString("x4"));
                    }
                    break;
            }
        }
        literal.Append("\"");
        return literal.ToString();
    }
8 голосов
/ 27 ноября 2008

Интересный вопрос.

Если вы не можете найти лучший метод, вы всегда можете заменить.
Если вы выбрали его, вы можете использовать этот C # Escape Sequence List :

  • \ '- одинарная кавычка, необходимая для символьных литералов
  • \ "- двойная кавычка, необходимая для строковых литералов
  • \ - обратный слеш
  • \ 0 - Unicode-символ 0
  • \ a - Оповещение (символ 7)
  • \ b - Backspace (символ 8)
  • \ f - подача формы (символ 12)
  • \ n - Новая строка (символ 10)
  • \ r - возврат каретки (символ 13)
  • \ t - Горизонтальная табуляция (символ 9)
  • \ v - Вертикальная кавычка (символ 11)
  • \ uxxxx - escape-последовательность Unicode для символа с шестнадцатеричным значением xxxx
  • \ xn [n] [n] [n] - escape-последовательность Юникода для символа с шестнадцатеричным значением nnnn (версия переменной длины \ uxxxx)
  • \ Uxxxxxxxx - escape-последовательность Unicode для символа с шестнадцатеричным значением xxxxxxxx (для генерации суррогатов)

Этот список можно найти в C # Часто задаваемые вопросы Какие доступны escape-последовательности символов?

6 голосов
/ 24 января 2013

Вот небольшое улучшение для ответа Smilediver, оно не ускользнет от всех символов без ASCII, но только они действительно необходимы.

using System;
using System.Globalization;
using System.Text;

public static class CodeHelper
{
    public static string ToLiteral(this string input)
    {
        var literal = new StringBuilder(input.Length + 2);
        literal.Append("\"");
        foreach (var c in input)
        {
            switch (c)
            {
                case '\'': literal.Append(@"\'"); break;
                case '\"': literal.Append("\\\""); break;
                case '\\': literal.Append(@"\\"); break;
                case '\0': literal.Append(@"\0"); break;
                case '\a': literal.Append(@"\a"); break;
                case '\b': literal.Append(@"\b"); break;
                case '\f': literal.Append(@"\f"); break;
                case '\n': literal.Append(@"\n"); break;
                case '\r': literal.Append(@"\r"); break;
                case '\t': literal.Append(@"\t"); break;
                case '\v': literal.Append(@"\v"); break;
                default:
                    if (Char.GetUnicodeCategory(c) != UnicodeCategory.Control)
                    {
                        literal.Append(c);
                    }
                    else
                    {
                        literal.Append(@"\u");
                        literal.Append(((ushort)c).ToString("x4"));
                    }
                    break;
            }
        }
        literal.Append("\"");
        return literal.ToString();
    }
}
2 голосов
/ 02 ноября 2017

Моя попытка добавить ToVerbatim к Халлгрим принял ответ выше:

private static string ToLiteral(string input)
{
    using (var writer = new StringWriter())
    {
        using (var provider = CodeDomProvider.CreateProvider("CSharp"))
        {
            provider.GenerateCodeFromExpression(new CodePrimitiveExpression(input), writer, new CodeGeneratorOptions { IndentString = "\t" });
            var literal = writer.ToString();
            literal = literal.Replace(string.Format("\" +{0}\t\"", Environment.NewLine), "");           
            return literal;
        }
    }
}

private static string ToVerbatim( string input )
{
    string literal = ToLiteral( input );
    string verbatim = "@" + literal.Replace( @"\r\n", Environment.NewLine );
    return verbatim;
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...