C # XML -> Как получить значение атрибута и xpath, который принадлежит этому элементу атрибутов - PullRequest
1 голос
/ 28 мая 2011

Я ищу способ просмотреть XML-файл и получить для некоторых атрибутов текст и xpath. Но я понятия не имею, как это сделать. Я знаю, как получить весь текст из нужных мне атрибутов, но проблема в том, что я не вижу xpath там, где он находится. Кто-нибудь может мне помочь? Код =

       // XML settings
        XmlReaderSettings settings = new XmlReaderSettings();
        settings.IgnoreWhitespace = true;
        settings.IgnoreComments = true;                        

        // Loop through the XML to get all text from the right attributes
        using (XmlReader reader = XmlReader.Create(sourceFilepathTb.Text, settings))
            while (reader.Read())
                if (reader.NodeType == XmlNodeType.Element)
                    if (reader.HasAttributes)
                        if (reader.GetAttribute("Caption") != null)


<?xml version="1.0" encoding="utf-8"?>
<Test Description="Test XML" VersionFormat="123" ProtectedContentText="(Test test)">
            <A Id="0" Caption="Test 0" />
            <A Id="1" Caption="Test 1" />
            <A Id="2" Caption="Test 2" />
            <A Id="3" Caption="Test 3">
                    <B Id="4" Caption="Test 4" />
            <Reason Id="5" Caption="Test 5" />
            <Reason Id="6" Caption="Test 6" />
            <Reason Id="7" Caption="Test 7" />

Ответы [ 3 ]

4 голосов
/ 28 мая 2011

ИМХО, LINQ to XML проще:

var document = XDocument.Load(fileName);

var captions = document.Descendants()
    .Select(arg => arg.Attribute("Caption"))
    .Where(arg => arg != null)
    .Select(arg => arg.Value)


Чтобы найти XPath для каждого элемента с атрибутом Caption:

var captions = document.Descendants()
    .Select(arg =>
            CaptionAttribute = arg.Attribute("Caption"),
            XPath = GetXPath(arg)
    .Where(arg => arg.CaptionAttribute != null)
    .Select(arg => new { Caption = arg.CaptionAttribute.Value, arg.XPath })

private static string GetXPath(XElement el)
    if (el.Parent == null)
        return "/" + el.Name.LocalName;

    var name = GetXPath(el.Parent) + "/" + el.Name.LocalName;

    if (el.Parent.Elements(el.Name).Count() != 1)
        return string.Format(@"{0}[{1}]", name, (el.ElementsBeforeSelf(el.Name).Count() + 1));
    return name;
2 голосов
/ 28 мая 2011

Вот начало. Вы можете потренироваться, как добавить начальный слеш.

using System;
using System.Xml;

namespace ConsoleApplication4 {
    class Program {
        static void Main(string[] args) {
            // XML settings
            XmlReaderSettings settings = new XmlReaderSettings();
            settings.IgnoreWhitespace = true;
            settings.IgnoreComments = true;

            // Loop through the XML to get all text from the right attributes
            using ( XmlReader reader = XmlReader.Create("Test.xml", settings) ) {
                while ( reader.Read() ) {
                    if ( reader.NodeType == XmlNodeType.Element ) {
                        Console.Write(reader.LocalName + "/"); // <<<<----
                        if ( reader.HasAttributes ) {
                            if ( reader.GetAttribute("Caption") != null ) {
            Console.Write("Press any key ..."); Console.ReadKey();

И просто, кстати, я стараюсь избегать такого глубокого вложения кода. Слишком трудно читать.

Приветствия. Кит.

РЕДАКТИРОВАТЬ: (дни спустя)

Наконец-то у меня появилось немного времени ... И я сел и сделал это "правильно". Это оказалось намного сложнее, чем я думал. ИМХО, это рекурсивное решение все еще легче найти, чем XSLT, что я нахожу бесконечно запутанным; -)

using System;
using System.Collections.Generic;
using System.IO;
using System.Xml;

namespace ConsoleApplication4 
    public class XPathGrepper : IDisposable
        private XmlReader _rdr;
        private TextWriter _out;

        public XPathGrepper(string xmlFilepath, TextWriter output) {
            _rdr = CreateXmlReader(xmlFilepath);
            _out = output;

        private static XmlReader CreateXmlReader(string xmlFilepath) {
            XmlReaderSettings settings = new XmlReaderSettings();
            settings.IgnoreWhitespace = true;
            settings.IgnoreComments = true;
            return XmlReader.Create(xmlFilepath, settings);

        // descends through the XML, printing the xpath to each @attributeName.
        public void Attributes(string attributeName) {
            Attributes(_rdr, attributeName, "/");
        // a recursive XML-tree descent, printing the xpath to each @attributeName.
        private void Attributes(XmlReader rdr, string attrName, string path) {
            // skip the containing element of the subtree (except root)
            if ( "/" != path ) 
            // count how many times we've seen each distinct path.
            var kids = new Histogram();
            // foreach node at-this-level in the tree
            while ( rdr.Read() ) {
                if (rdr.NodeType == XmlNodeType.Element) {
                    // build the xpath-string to this element
                    string nodePath = path + _rdr.LocalName;
                    nodePath += "[" + kids.Increment(nodePath) + "]/";
                    // print the xpath to the Caption attribute of this node
                    if ( _rdr.HasAttributes && _rdr.GetAttribute(attrName) != null ) {
                        _out.WriteLine(nodePath + "@" + attrName);
                    // recursively read the subtree of this element.
                    Attributes(rdr.ReadSubtree(), attrName, nodePath);

        public void Dispose() {
            if ( _rdr != null ) _rdr.Close();

        private static void Pause() {
            Console.Write("Press enter to continue....");

        static void Main(string[] args) {
            using ( var grep = new XPathGrepper("Test.xml", Console.Out) ) {

        private class Histogram : Dictionary<string, int>
            public int Increment(string key) {
                if ( base.ContainsKey(key) )
                    base[key] += 1;
                    base.Add(key, 1);
                return base[key];

1 голос
/ 28 мая 2011

Простое и точное решение XSLT :

<xsl:stylesheet version="1.0"
 <xsl:output method="text"/>

 <xsl:template match="/">
  <xsl:apply-templates select="//@Caption"/>

 <xsl:template match="@Caption">
  <xsl:apply-templates select="." mode="path"/>
  <xsl:value-of select="concat(': ',.,'&#xA;')"/>

 <xsl:template match="@Caption" mode="path">
  <xsl:for-each select="ancestor::*">
   <xsl:value-of select="concat('/',name())"/>

   <xsl:variable name="vSiblings" select=

   <xsl:if test="$vSiblings > 1">
     <xsl:value-of select="
                [name()=name(current())]) +1,


когда это преобразование применяется к предоставленному документу XML :

<Test Description="Test XML" VersionFormat="123" ProtectedContentText="(Test test)">
            <A Id="0" Caption="Test 0" />
            <A Id="1" Caption="Test 1" />
            <A Id="2" Caption="Test 2" />
            <A Id="3" Caption="Test 3">
                    <B Id="4" Caption="Test 4" />
            <Reason Id="5" Caption="Test 5" />
            <Reason Id="6" Caption="Test 6" />
            <Reason Id="7" Caption="Test 7" />

желаемый, правильный результат получается :

/Test/Testapp/TestappA/A[1]/@Caption: Test 0
/Test/Testapp/TestappA/A[2]/@Caption: Test 1
/Test/Testapp/TestappA/A[3]/@Caption: Test 2
/Test/Testapp/TestappA/A[4]/@Caption: Test 3
/Test/Testapp/TestappA/A[4]/AA/B/@Caption: Test 4
/Test/Testapp/AA/Reason[1]/@Caption: Test 5
/Test/Testapp/AA/Reason[2]/@Caption: Test 6
/Test/Testapp/AA/Reason[3]/@Caption: Test 7

Примечание: : это единственное решение, представленное на данный момент, которое генерирует точное выражение XPath для любого отдельного атрибута Caption.


выбирает 4 узла атрибута, тогда как :


выбирает только один атрибутный узел, и это то, что действительно нужно .
