Как предотвратить повторяющиеся записи в списке, а затем, в идеале, отсортировать этот список? То, что я делаю, - это когда информация на одном уровне отсутствует, беря информацию с уровня ниже его, для построения недостающего списка на уровне выше. В настоящее время у меня есть XML, похожий на это:

<c03 id="ref6488" level="file">
        <unittitle>Clinic Building</unittitle>
        <unitdate era="ce" calendar="gregorian">1947</unitdate>
    <c04 id="ref34582" level="file">
            <container label="Box" type="Box">156</container>
            <container label="Folder" type="Folder">3</container>
    <c04 id="ref6540" level="file">
            <container label="Box" type="Box">156</container>
            <unittitle>Contact prints</unittitle>
    <c04 id="ref6606" level="file">
            <container label="Box" type="Box">154</container>

Затем я применяю следующий XSL:

<xsl:template match="c03/did">
        <xsl:when test="not(container)">
                <!-- If no c03 container item is found, look in the c04 level for one -->
                <xsl:if test="../c04/did/container">

                    <!-- If a c04 container item is found, use the info to build a c03 version -->
                    <!-- Skip c03 container item, if still no c04 items found -->
                    <container label="Box" type="Box">

                        <!-- Build container list -->
                        <!-- Test for more than one item, and if so, list them, -->
                        <!-- separated by commas and a space -->
                        <xsl:for-each select="../c04/did">
                            <xsl:if test="position() &gt; 1">, </xsl:if>
                            <xsl:value-of select="container"/>

        <!-- If there is a c03 container item(s), list it normally -->
            <xsl:copy-of select="."/>

Но я получаю "контейнерный" результат

<container label="Box" type="Box">156, 156, 154</container>

когда я хочу

<container label="Box" type="Box">154, 156</container>

Ниже приведен полный результат, который я пытаюсь получить:

<c03 id="ref6488" level="file">
        <container label="Box" type="Box">154, 156</container>
        <unittitle>Clinic Building</unittitle>
        <unitdate era="ce" calendar="gregorian">1947</unitdate>
    <c04 id="ref34582" level="file">
            <container label="Box" type="Box">156</container>
            <container label="Folder" type="Folder">3</container>
    <c04 id="ref6540" level="file">
            <container label="Box" type="Box">156</container>
            <unittitle>Contact prints</unittitle>
    <c04 id="ref6606" level="file">
            <container label="Box" type="Box">154</container>

Заранее спасибо за любую помощь!

/ 20 апреля 2010

Для этой проблемы не требуется решение XSLT 2.0 .

Вот решение XSLT 1.0, которое является более компактным, чем выбранное в настоящее время решение XSLT 2.0 (35 строк против 43 строк):

<xsl:stylesheet version="1.0"
    <xsl:output omit-xml-declaration="yes" indent="yes"/>
    <xsl:strip-space elements="*"/>

    <xsl:key name="kBoxContainerByVal"
     match="container[@type='Box']" use="."/>

 <xsl:template match="node()|@*">
       <xsl:apply-templates select="node()|@*"/>

 <xsl:template match="c03/did[not(container)]">

   <xsl:variable name="vContDistinctValues" select=
             generate-id(key('kBoxContainerByVal', .)[1])

    <container label="Box" type="Box">
      <xsl:for-each select="$vContDistinctValues">
        <xsl:sort data-type="number"/>

        <xsl:value-of select=
        "concat(., substring(', ', 1 + 2*(position() = last())))"/>

Когда это преобразование применяется к первоначально предоставленному XML-документу, получается правильный желаемый результат :

<c03 id="ref6488" level="file">
      <container label="Box" type="Box">156, 154</container>
      <unittitle>Clinic Building</unittitle>
      <unitdate era="ce" calendar="gregorian">1947</unitdate>
   <c04 id="ref34582" level="file">
         <container label="Box" type="Box">156</container>
         <container label="Folder" type="Folder">3</container>
   <c04 id="ref6540" level="file">
         <container label="Box" type="Box">156</container>
         <unittitle>Contact prints</unittitle>
   <c04 id="ref6606" level="file">
         <container label="Box" type="Box">154</container>


Я не заметил требования, чтобы номера контейнеров выглядели отсортированными. Теперь решение отражает это.

/ 20 апреля 2010

По-настоящему XSLT 2.0, также довольно короткое :

<xsl:stylesheet  version="2.0"
  <xsl:output omit-xml-declaration="yes" indent="yes"/>

  <xsl:template match="node()|@*">
      <xsl:apply-templates select="node()|@*"/>

  <xsl:template match="c03/did[not(container)]">
      <xsl:copy-of select="@*"/>

      <xsl:variable name="vContDistinctValues" as="xs:integer*">
        <xsl:perform-sort select=

      <xsl:if test="$vContDistinctValues">
        <container label="Box" type="Box">
          <xsl:value-of select="$vContDistinctValues" separator=","/>


  1. Использование типов избавляет от необходимости указывать data-type в <xsl:sort/>.

  2. Использование атрибута separator <xsl:value-of/>

/ 20 апреля 2010

Немного более короткая версия XSLT 2.0, сочетающая подходы из других ответов. Обратите внимание, что сортировка осуществляется по алфавиту, поэтому, если найдены метки «54» и «156», на выходе будет «156, 54». Если требуется числовая сортировка, используйте <xsl:sort select="number(.)"/> вместо <xsl:sort/>.

<xsl:stylesheet version="2.0" 
    <xsl:output omit-xml-declaration="yes" indent="yes"/> 
    <xsl:strip-space elements="*"/>

    <xsl:template match="node()|@*"> 
            <xsl:apply-templates select="node()|@*"/> 

    <xsl:template match="c03/did[not(container)]">
        <xsl:variable name="containers" 
            <xsl:copy-of select="@*"/>
            <xsl:if test="$containers">
                <container label="Box" type="Box">
                    <xsl:for-each select="distinct-values($containers)">
                        <xsl:if test="position() != 1">, </xsl:if>
                        <xsl:value-of select="."/>
            <xsl:apply-templates select="node()"/> 
/ 19 апреля 2010

Попробуйте следующий код:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="2.0">
  <xsl:output indent="yes"></xsl:output>

<xsl:template match="node() | @*">
    <xsl:apply-templates select="node() | @*"/>

  <xsl:template match="c03/did">
      <xsl:when test="not(container)">
          <!-- If no c03 container item is found, look in the c04 level for one -->
          <xsl:if test="../c04/did/container">
            <xsl:variable name="foo" select="../c04/did/container[@type='Box']/text()"/>
            <!-- If a c04 container item is found, use the info to build a c03 version -->
            <!-- Skip c03 container item, if still no c04 items found -->
            <container label="Box" type="Box">

              <!-- Build container list -->
              <!-- Test for more than one item, and if so, list them, -->
              <!-- separated by commas and a space -->
              <xsl:for-each select="distinct-values($foo)">
                <xsl:sort />
                <xsl:if test="position() &gt; 1">, </xsl:if>
                <xsl:value-of select="." />
            <xsl:apply-templates select="*" />

      <!-- If there is a c03 container item(s), list it normally -->
        <xsl:copy-of select="."/>


Это выглядит примерно так, как вы хотите:

<?xml version="1.0" encoding="UTF-8"?>
<c03 id="ref6488" level="file">
      <container label="Box" type="Box">154, 156</container>
      <unittitle>Clinic Building</unittitle>
      <unitdate era="ce" calendar="gregorian">1947</unitdate>
  <c04 id="ref34582" level="file">
         <container label="Box" type="Box">156</container>
         <container label="Folder" type="Folder">3</container>
  <c04 id="ref6540" level="file">
         <container label="Box" type="Box">156</container>
         <unittitle>Contact prints</unittitle>
  <c04 id="ref6606" level="file">
         <container label="Box" type="Box">154</container>

Хитрость заключается в использовании <xsl:sort> и distinct-values() вместе.Смотрите (ИМХО) отличную книгу Майкла Кей "XSLT 2.0 и XPATH 2.0"

/ 19 апреля 2010

попробуйте использовать группу ключей в xslt, вот статья о методе Muenchian, которая должна помочь устранить дубликаты. http://www.jenitennison.com/xslt/grouping/muenchian.html

/ 19 апреля 2010

Следующее преобразование XSLT 1.0 делает то, что вы ищете

  <xsl:output encoding="utf-8" />

  <!-- key to index containers by these three distinct qualities: 
       1: their ancestor <c??> node (represented as its unique ID)
       2: their @type attribute value
       3: their node value (i.e. their text) -->
    name  = "kContainer" 
    match = "container"
    use   = "concat(generate-id(../../..), '|', @type, '|', .)"

  <!-- identity template to copy everything as is by default -->
  <xsl:template match="node()|@*">
      <xsl:apply-templates select="node()|@*" />

  <!-- special template for <did>s without a <container> child -->
  <xsl:template match="did[not(container)]">
      <xsl:copy-of select="@*" />
      <container label="Box" type="Box">
        <!-- from subordinate <container>s of type Box, use the ones
             that are *the first* to have that certain combination 
             of the three distinct qualities mentioned above -->
        <xsl:apply-templates mode="list-values" select="
                concat(generate-id(../../..), '|', @type, '|', .)
          <!-- sort them by their node value -->
          <xsl:sort select="." data-type="number" />
      <xsl:apply-templates select="node()" />

  <!-- generic template to make list of values from any node-set -->
  <xsl:template match="*" mode="list-values">
    <xsl:value-of select="." />
    <xsl:if test="position() &lt; last()">
      <xsl:text>, </xsl:text>



<c03 id="ref6488" level="file">
    <container label="Box" type="Box">154, 156</container>
    <unittitle>Clinic Building</unittitle>
    <unitdate era="ce" calendar="gregorian">1947</unitdate>
  <c04 id="ref34582" level="file">
      <container label="Box" type="Box">156</container>
      <container label="Folder" type="Folder">3</container>
  <c04 id="ref6540" level="file">
      <container label="Box" type="Box">156</container>
      <unittitle>Contact prints</unittitle>
  <c04 id="ref6606" level="file">
      <container label="Box" type="Box">154</container>

Часть generate-id() = generate-id(key(...)[1]) - это то, что называется мюнхенской группировкой. Если вы не можете использовать XSLT 2.0, это путь.
