Слабое слияние документов XML - PullRequest
2 голосов
/ 31 июля 2009

У меня есть два документа - один представляет собой пользовательский формат файла XML, а другой - канал RSS со множеством пользовательских расширений. Я хочу заполнить поля в файле XML значениями, найденными в ленте RSS, когда совпадает одно значение элемента.

Это для автономного процесса, который будет запускаться несколько раз вручную - он не должен хорошо работать, быть достаточно отказоустойчивым и т. Д. Ручной труд или вмешательство хороши.

Мой основной XML-документ выглядит так:

    <videos>
        <video>
            <title>First Video</title>
            <code>AAA123</code>
            <id>decaf-decaf-decaf-decaf</id>
            <description>lots of text here...</description>
        </video>
        <video>
            <title>Second Video with no code</title>
            <code></code>
            <id>badab-badab-badab-badab</id>
            <description>lots of text here...</description>
        </video>
    </videos>

Канал RSS является стандартным RSS с некоторым дополнительным полем:

  <ns:code>AAA123</ns:code>
  <ns:type>Awesome</ns:type>
  <ns:group>Wonderful</ns:group>

Я бы хотел вытащить дополнительные поля из документа RSS в документ XML, когда value matches the value:</p> <pre> <videos> <video> <title>First Video</title> <code>AAA123 без кофеина-кофе без кофеина, кофе без кофеина, кофе без кофеина много текста здесь ... Высокий Замечательный Второе видео без кода Бадаб-Бадаб-Бадаб-Бадаб много текста здесь ...

Я бы больше всего хотел использовать c #, LINQ или какой-нибудь Excel-fu. Я полагаю, что если бы мне пришлось, я мог бы иметь дело с XSLT до тех пор, пока это не потребует от меня много написания XSLT.

Я посмотрел на этот вопрос, но он не очень помог мне в том, что я пытаюсь сделать: Объединение документов XML

Ответы [ 2 ]

5 голосов
/ 31 июля 2009

Звучит как работа для LINQ to XML!

var vidDoc = XDocument.Parse(vidXml);
var rssDoc = XDocument.Parse(rssXml);
var videos = vidDoc.XPathSelectElements("/videos/video");
var rssItems = rssDoc.XPathSelectElements("/rss/channel/item");
var matches = videos.Join(
    rssItems,
    video => video.Element(XName.Get("code")).Value,
    rssItem => rssItem.Element(XName.Get("code", "http://test.com")).Value,
    (video, item) => new {video, item});

foreach (var match in matches)
{
    var children = match.item.Elements()
        .Where(child => child.Name.NamespaceName == "http://test.com" &&
                        child.Name.LocalName != "code");

    foreach (var child in children)
    {
        //remove the namespace
        child.Name = XName.Get(child.Name.LocalName);
        match.video.Add(child);
    }
}

vidDoc.Save(Console.Out);

Приведенное выше решение предполагает, что документ RSS выглядит примерно так:

<rss xmlns:ns="http://test.com" version="2.0">
  <channel>
    <item>
      <title>AAA123</title>
      <link>http://test.com/AAA123</link>
      <pubDate>Sun, 26 Jul 2009 23:59:59 -0800</pubDate>
      <ns:code>AAA123</ns:code>
      <ns:type>Awesome</ns:type>
      <ns:group>Wonderful</ns:group>
    </item>
  </channel>
</rss>
1 голос
/ 31 июля 2009

Добавьте это к преобразованию идентичности XSLT (вам также необходимо добавить объявление пространства имен для пространства имен http://test.com в элемент верхнего уровня преобразования):

<xsl:variable name="rss" select="document('rss.xml')"/>

<xsl:template match="video">
   <xsl:apply-templates select="@* | node()"/>
   <xsl:apply-templates select="$rss/rss/channel/item[ns:code=current()/code]"/>
</xsl:template>

<!-- this keeps the code element from getting copied -->
<xsl:template match="ns:code"/>

<!-- this will copy all of the content of the ns:* elements, not just their text -->
<xsl:template match="ns:*">
   <xsl:element name="{local-name()}">
      <xsl:apply-templates select="@* | node()"/>
   </xsl:element>
</xsl:template>

Если вы уже прочитали RSS в XmlDocument в своей программе, вы можете передать его в XSLT в качестве параметра вместо использования функции document() для чтения.

...