Производительность метода расширения .NET IsValidXml - PullRequest
3 голосов
/ 08 апреля 2010

У меня есть унаследованное унаследованное приложение, которое передает множество XML в виде строк.

Мне часто нужна возможность проверить, будет ли строка действительным XML. Какой самый быстрый и наименее дорогой способ проверить, является ли строка допустимым XML в .NET?

Я работаю в .NET 3.5 и, скорее всего, использовал бы его как метод расширения (вне строки) в этом одном проекте решения.

UPDATE
То, что я имею в виду под «допустимым» в моем случае, это правильно сформированный XML. Мне не нужно проверять ресурсы или схему.

Ответы [ 3 ]

2 голосов
/ 08 апреля 2010

Согласен с Адамом и версией XElement:

public static class XmlUtilities
{

    public static bool IsXml(this string data)
    {
        if (string.IsNullOrEmpty(data)) return false;

        try
        {
            var doc = XElement.Parse(data)

            return true;            
        }
        catch (XmlException)
        {
            return false;
        }
    }
}
2 голосов
/ 08 апреля 2010

Мне неизвестно о встроенном средстве в .NET для проверки правильности (?) XML без его анализа. Учитывая это, что-то вроде этого должно работать:

public static class XmlUtilities
{
    public static bool IsXml(this string data)
    {
        if (string.IsNullOrEmpty(data)) return false;

        try
        {
            System.Xml.XmlDocument doc = new System.Xml.XmlDocument();

            doc.LoadXml(data);

            return true;            
        }
        catch
        {
            return false;
        }
    }
}
1 голос
/ 09 апреля 2010

Невозможно проверить правильность правильности XML-строки без ее анализа. И быстрый тест показывает, что самый быстрый способ синтаксического анализа строки, чтобы убедиться, что она действительна (на самом деле самый быстрый способ анализа конкретной строки, которую я использовал в качестве тестового примера), - это XmlReader:

    static void Main(string[] args)
    {
        const int iterations = 20000;
        const string xml = @"<foo><bar><baz a='b' c='d'/><foo><bar><baz a='b' c='d'/></bar><bar/></foo><foo><bar><baz a='b' c='d'/></bar><bar/></foo><foo><bar><baz a='b' c='d'/></bar><bar/></foo><foo><bar><baz a='b' c='d'/></bar><bar/></foo><foo><bar><baz a='b' c='d'/></bar><bar/></foo><foo><bar><baz a='b' c='d'/></bar><bar/></foo><foo><bar><baz a='b' c='d'/></bar><bar/></foo><foo><bar><baz a='b' c='d'/></bar><bar/></foo><foo><bar><baz a='b' c='d'/></bar><bar/></foo></bar><bar/></foo>";

        Stopwatch st = new Stopwatch();

        st.Start();
        for (int i=0; i<iterations; i++)
        {
            using (StringReader sr = new StringReader(xml))
            using (XmlReader xr = XmlReader.Create(sr))
            {
                while (xr.Read())
                {
                }
            }
        }
        st.Stop();
        Console.WriteLine(String.Format("XmlReader: {0} ms.", st.ElapsedMilliseconds));

        st.Reset();
        st.Start();
        for (int i=0; i<iterations; i++)
        {
            XElement.Parse(xml);
        }
        st.Stop();
        Console.WriteLine(String.Format("XElement: {0} ms.", st.ElapsedMilliseconds));

        st.Reset();
        st.Start();
        for (int i = 0; i < iterations; i++)
        {
            XmlDocument d= new XmlDocument();
            d.LoadXml(xml);
        }
        st.Stop();
        Console.WriteLine(String.Format("XmlDocument: {0} ms.", st.ElapsedMilliseconds));

        st.Reset();
        st.Start();
        for (int i = 0; i < iterations; i++)
        {
            using (StringReader sr = new StringReader(xml))
            {
                XPathDocument d = new XPathDocument(new StringReader(xml));                    
            }
        }
        st.Stop();
        Console.WriteLine(String.Format("XPathDocument: {0} ms.", st.ElapsedMilliseconds));

        Console.ReadKey();
    }

На моей машине XmlReader почти в два раза быстрее, чем любая из альтернатив. Это имеет смысл. Хотя я не использовал Reflector для проверки, я был бы очень удивлен, если бы XmlDocument, XDocument и XPathDocument не все использовали XmlReader под капотом.

...