Это удивительно сложно сделать.
Взгляните на Рекомендацию XPath , и вы увидите, что она определяет литерал как:
Literal ::= '"' [^"]* '"'
| "'" [^']* "'"
То есть строковые литералы в выражениях XPath могут содержать апострофы или двойные кавычки, но не оба одновременно.
Вы не можете использовать побег, чтобы обойти это. Буквально такой:
'Some'Value'
будет соответствовать этому XML-тексту:
Some'Value
Это означает, что может существовать фрагмент текста XML, который вы не можете сгенерировать для литерала XPath, например ::
<elm att=""&apos"/>
Но это не значит, что невозможно сопоставить этот текст с XPath, это просто сложно. В любом случае, когда значение, которое вы пытаетесь сопоставить, содержит как одинарные, так и двойные кавычки, вы можете создать выражение, которое использует concat
для получения текста, который будет соответствовать:
elm[@att=concat('"', "'")]
Итак, это подводит нас к этому, что намного сложнее, чем хотелось бы:
/// <summary>
/// Produce an XPath literal equal to the value if possible; if not, produce
/// an XPath expression that will match the value.
///
/// Note that this function will produce very long XPath expressions if a value
/// contains a long run of double quotes.
/// </summary>
/// <param name="value">The value to match.</param>
/// <returns>If the value contains only single or double quotes, an XPath
/// literal equal to the value. If it contains both, an XPath expression,
/// using concat(), that evaluates to the value.</returns>
static string XPathLiteral(string value)
{
// if the value contains only single or double quotes, construct
// an XPath literal
if (!value.Contains("\""))
{
return "\"" + value + "\"";
}
if (!value.Contains("'"))
{
return "'" + value + "'";
}
// if the value contains both single and double quotes, construct an
// expression that concatenates all non-double-quote substrings with
// the quotes, e.g.:
//
// concat("foo", '"', "bar")
StringBuilder sb = new StringBuilder();
sb.Append("concat(");
string[] substrings = value.Split('\"');
for (int i = 0; i < substrings.Length; i++ )
{
bool needComma = (i>0);
if (substrings[i] != "")
{
if (i > 0)
{
sb.Append(", ");
}
sb.Append("\"");
sb.Append(substrings[i]);
sb.Append("\"");
needComma = true;
}
if (i < substrings.Length - 1)
{
if (needComma)
{
sb.Append(", ");
}
sb.Append("'\"'");
}
}
sb.Append(")");
return sb.ToString();
}
И да, я проверял это со всеми крайними случаями. Вот почему логика настолько тупо сложна:
foreach (string s in new[]
{
"foo", // no quotes
"\"foo", // double quotes only
"'foo", // single quotes only
"'foo\"bar", // both; double quotes in mid-string
"'foo\"bar\"baz", // multiple double quotes in mid-string
"'foo\"", // string ends with double quotes
"'foo\"\"", // string ends with run of double quotes
"\"'foo", // string begins with double quotes
"\"\"'foo", // string begins with run of double quotes
"'foo\"\"bar" // run of double quotes in mid-string
})
{
Console.Write(s);
Console.Write(" = ");
Console.WriteLine(XPathLiteral(s));
XmlElement elm = d.CreateElement("test");
d.DocumentElement.AppendChild(elm);
elm.SetAttribute("value", s);
string xpath = "/root/test[@value = " + XPathLiteral(s) + "]";
if (d.SelectSingleNode(xpath) == elm)
{
Console.WriteLine("OK");
}
else
{
Console.WriteLine("Should have found a match for {0}, and didn't.", s);
}
}
Console.ReadKey();
}