Мне нужно преобразовать основанную на html структуру в документ xml на основе значения атрибута. Ниже я упомянул структуру ввода.
<body>
<p class='h1'>the fisr A</p>
<p class='txt'>one</p>
<p>tow</p>
<p class='h2' status='remove'></p>
<p class='h3'>the sec sec B</p>
<p class='txt'>the next text</p>
<p class='h3'>the fisr C</p>
<p class='txt'>four</p>
<p class='txt'>five</p>
<p class='h1' status="remove">the seccond A</p>
<p class='txt'>the seccond txt</p>
<p class='h2'>the second B</p>
<p class='txt'>six</p>
<p class='txt'>seven</p>
<p class='h1' status="remove">the third A</p>
<p class='txt'>eight</p>
<p class='h2' status="remove">the third A</p>
<p class='h3'>the third A</p>
<p class='txt'>the third A</p>
</body>
Мой ожидаемый результат указан ниже. Здесь мне нужно сгруппировать элементы на основе h1, h2, h3. Но условие состоит в том, что после группировки элементов мы должны удалить элементы, которые имеют статус атрибута со значением «удалить».
<book>
<sectionA>
<title>the fisr A</title>
<p xmlns="http://www.w3.org/1999/xhtml" class="txt">one</p>
<p xmlns="http://www.w3.org/1999/xhtml">tow</p>
<sectionC>
<title>the sec sec B</title>
<p xmlns="http://www.w3.org/1999/xhtml" class="txt">the next text</p>
</sectionC>
<sectionC>
<title>the fisr C</title>
<p xmlns="http://www.w3.org/1999/xhtml" class="txt">four</p>
<p xmlns="http://www.w3.org/1999/xhtml" class="txt">five</p>
</sectionC>
</sectionA>
<sectionB>
<title>the second B</title>
<p xmlns="http://www.w3.org/1999/xhtml" class="txt">six</p>
<p xmlns="http://www.w3.org/1999/xhtml" class="txt">seven</p>
</sectionB>
<sectionC>
<title>the third A</title>
<p xmlns="http://www.w3.org/1999/xhtml" class="txt">the third A</p>
</sectionC>
</book>
Я попытался с помощью приведенного ниже xslt. Я обработал группировку внутри переменной, а затем попытался удалить заголовок с атрибутом status. Но это работает.
<xsl:template match="body">
<xsl:variable name="sequence">
<book>
<xsl:for-each-group select="p" group-starting-with="p[@class='h1']">
<sectionA>
<xsl:copy-of select="@*"></xsl:copy-of>
<title>
<xsl:value-of select="node()"/>
</title>
<xsl:for-each-group select="current-group() except ." group-starting-with="p[@class='h2']">
<xsl:choose>
<xsl:when test="self::p[@class='h2']">
<sectionB>
<xsl:copy-of select="@*"></xsl:copy-of>
<title>
<xsl:value-of select="node()"/>
</title>
<xsl:for-each-group select="current-group() except ." group-starting-with="p[@class='h3']">
<xsl:choose>
<xsl:when test="self::p[@class='h3']">
<sectionC>
<xsl:copy-of select="@*"></xsl:copy-of>
<title>
<xsl:value-of select="node()"/>
</title>
<xsl:apply-templates select="current-group() except ."></xsl:apply-templates>
</sectionC>
</xsl:when>
<xsl:otherwise>
<xsl:apply-templates select="current-group()"></xsl:apply-templates>
</xsl:otherwise>
</xsl:choose>
</xsl:for-each-group>
</sectionB>
</xsl:when>
<xsl:otherwise>
<xsl:apply-templates select="current-group()"></xsl:apply-templates>
</xsl:otherwise>
</xsl:choose>
</xsl:for-each-group>
</sectionA>
</xsl:for-each-group>
</book>
</xsl:variable>
<xsl:variable name="modifiedseq">
<xsl:apply-templates select="$sequence/node()"></xsl:apply-templates>
</xsl:variable>
<xsl:apply-templates select="$modifiedseq"></xsl:apply-templates>
</xsl:template>
<xsl:template match="p">
<xsl:copy>
<xsl:copy-of select="@*"/>
<xsl:apply-templates select="node()"/>
</xsl:copy>
</xsl:template>
Группировка в порядке h1, h2, h3. Предположим, что если в h2 есть атрибут status = 'remove', то последовательность h1, h2. Пожалуйста, кто-нибудь, попробуйте мне помочь.