Преобразование XML в CSV - подробности - PullRequest
0 голосов
/ 13 июля 2010

У меня проблемы с правильной формулировкой преобразования.Я генерирую файлы CSV.Я могу легко сгенерировать следующий csv:

   "version","","stuff",
    "version1version2","annotation1annotation2","yadda",

Однако я хотел бы, чтобы различные экземпляры подполей были разделены запятыми в своей строке следующим образом:

"version","","stuff",
"version1,version2","annotation1,annotation2","yadda",

Myввод выглядит примерно так:

<?xml version="1.0" encoding="UTF-8"?>
<collection>
  <record>
    <datafield tag="020">
      <subfield code="a">version</subfield>
    </datafield>
    <datafield tag="040">
      <subfield code="b">stuff</subfield>
    </datafield>
  </record>
  <record>
    <datafield tag="020">
      <subfield code="a">version1</subfield>
      <subfield code="9">annotation1</subfield>
    </datafield>
    <datafield tag="020">
      <subfield code="a">version2</subfield>
      <subfield code="9">annotation2</subfield>
    </datafield>
    <datafield tag="040">
      <subfield code="b">yadda</subfield>
    </datafield>
  </record>
</collection>

Использование следующих xsl (и xsltproc)

<?xml version="1.0"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
<xsl:output method="text"/>

<xsl:template match="/">
  <xsl:apply-templates select="collection/record"/>
</xsl:template>

<xsl:template match="record">
  <xsl:text>"</xsl:text>
  <xsl:apply-templates select="datafield[@tag='020']/subfield[@code='a']"/>
  <xsl:text>",</xsl:text>

  <xsl:text>"</xsl:text>
  <xsl:apply-templates select="datafield[@tag='020']/subfield[@code='9']"/>
  <xsl:text>",</xsl:text>

  <xsl:text>"</xsl:text>
  <xsl:apply-templates select="datafield[@tag='040']/subfield[@code='b']"/>
  <xsl:text>",</xsl:text>

  <xsl:text>
</xsl:text>
</xsl:template>

Я бы предположил, что некоторая комбинация follow-sibling :: or not (position () = last()) будет задействован call-template, но я еще не нашел рабочего решения.Любая помощь?

Я не ищу универсальное преобразование XML в CSV - все, что связано с этим конкретным набором данных, хорошо.

Ответы [ 2 ]

1 голос
/ 13 июля 2010

В более общем виде эта таблица стилей:

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="text"/>
    <xsl:key name="field" match="subfield" use="concat(../@tag,'&#xA;',@code)"/>
    <xsl:variable name="fields" select="/*/*/*/subfield[count(.|key('field',concat(../@tag,'&#xA;',@code))[1])=1]"/>
    <xsl:template match="record">
        <xsl:variable name="me" select="."/>
        <xsl:for-each select="$fields">
            <xsl:text>"</xsl:text>
            <xsl:apply-templates select="$me/*/*[concat(../@tag,'&#xA;',@code)=concat(current()/../@tag,'&#xA;',current()/@code)]"/>
            <xsl:text>"</xsl:text>
            <xsl:if test="position() != last()">,</xsl:if>
        </xsl:for-each>
        <xsl:text>&#xA;</xsl:text>
    </xsl:template>
    <xsl:template match="subfield">
        <xsl:value-of select="."/>
        <xsl:if test="position() != last()">,</xsl:if>
    </xsl:template>
</xsl:stylesheet>

Результат:

"version","stuff",""
"version1,version2","yadda","annotation1,annotation2"
1 голос
/ 13 июля 2010
<xsl:template match="record">
  <xsl:text>"</xsl:text>
  <xsl:apply-templates select="datafield[@tag='020']/subfield[@code='a']" />
  <xsl:text>",</xsl:text>

  <xsl:text>"</xsl:text>
  <xsl:apply-templates select="datafield[@tag='020']/subfield[@code='9']" />
  <xsl:text>",</xsl:text>

  <xsl:text>"</xsl:text>
  <xsl:apply-templates select="datafield[@tag='040']/subfield[@code='b']" />
  <xsl:text>",</xsl:text>

  <xsl:text>&#xa;</xsl:text><!-- line break -->
</xsl:template>

<xsl:template match="subfield">
  <xsl:value-of select="." />
  <xsl:if test="position() != last()">,</xsl:if>
</xsl:template>

Для больших наборов входных данных введение ключа приведет к повышению общей производительности:

<xsl:key name="kSubfield" match="datafield/subfield" use="
  concat(
    generate-id(ancestor::record), '|', parent::datafield/@tag, '|',  @code
  )
" />

<!-- ... -->

<xsl:template match="record">
  <xsl:variable name="recordId" select="generate-id()" />

  <xsl:text>"</xsl:text>
  <xsl:apply-templates select="key('kSubfield', concat($recordId, '|020|a'))" />
  <xsl:text>",</xsl:text>

  <xsl:text>"</xsl:text>
  <xsl:apply-templates select="key('kSubfield', concat($recordId, '|020|9'))" />
  <xsl:text>",</xsl:text>

  <xsl:text>"</xsl:text>
  <xsl:apply-templates select="key('kSubfield', concat($recordId, '|040|b'))" />
  <xsl:text>",</xsl:text>

  <xsl:text>&#xa;</xsl:text><!-- line break -->
</xsl:template>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...