xslt php выберите первого родного брата и все его дочерние узлы - PullRequest
0 голосов
/ 11 февраля 2010

Как выбрать первого родственного элемента узла xml со всеми его дочерними узлами и применить к нему некоторые преобразования? До сих пор мне удавалось выбрать только первого родного брата и только первого родного брата (без дочерних узлов) или все, что следует за узлом xml.

Скажем, у нас есть такой xhtml:

<div class="chapter">Chapter <span class="number">1.1</span> Lorum ipsum</div>
<h2 class="article">Article <span class="number">1.</span> Lorum ipsum</h2>
<p>Lorum ipsum</p>

И результат, к которому мы стремимся, выглядит так:

    <title>Lorum ipsum</title>
      <title>Lorum ipsum</title>
    <par>Lorum ipsum</par>

Полагаю, мне нужно сделать магию регулярных выражений, чтобы правильно подобрать метки и теги заголовков, но если бы это также можно было сделать с использованием простого xslt, это было бы здорово.

Ответы [ 2 ]

1 голос
/ 11 февраля 2010

Эта таблица стилей создает желаемый результат:

<xsl:template match="html:div[@class='chapter']" mode="chapter">
    <xsl:element name="{@class}">
            <xsl:apply-templates mode="chapter" />
        <xsl:apply-templates select="following-sibling::html:h2[generate-id(preceding-sibling::html:div[@class='chapter'][1])=generate-id(current())]" mode="chapter" />

<!--template for h2 in "chapter" mode, creates article content for the chapter-->
<xsl:template match="html:h2[@class='article']" mode="chapter">
    <xsl:element name="{@class}">
            <xsl:apply-templates mode="chapter"/>
        <xsl:apply-templates select="following-sibling::html:p[generate-id(preceding-sibling::html:h2[@class='article'][1])=generate-id(current())]" mode="chapter" />

<xsl:template match="text()[following-sibling::html:span[@class='number']]" mode="chapter">
    <label><xsl:value-of select="normalize-space()"/></label>

<!--Generate an (number) element using the class attribute as the name of the element-->
<xsl:template match="html:span[@class='number']" mode="chapter">
    <xsl:element name="{@class}">
        <xsl:value-of select="."/>

<!--title elements created for text nodes before the -->
<xsl:template match="text()[preceding-sibling::html:span[@class='number']]" mode="chapter">
    <title><xsl:value-of select="normalize-space()"/></title>

<!--Template in "chapter" mode, creates a par element inside the article-->
<xsl:template match="html:p" mode="chapter">
    <para><xsl:value-of select="normalize-space()"/></para>

<!--prevent text from bleeding through in output-->
<xsl:template match="text()" mode="chapter"/>

Используя Томалак в качестве примера входного XML, выдает:

<?xml version="1.0" encoding="UTF-8"?>
            <title>Lorum ipsum</title>
                <title>Lorum ipsum</title>
            <para>Lorum ipsum A</para>
            <para>Lorum ipsum B</para>
                <title>Lorum ipsum</title>
            <para>Lorum ipsum D</para>
                <title>Lorum ipsum</title>
            <para>Lorum ipsum E</para>
            <para>Lorum ipsum F</para>
            <title>Lorum ipsum</title>
                <title>Lorum ipsum</title>
            <para>Lorum ipsum G</para>
1 голос
/ 11 февраля 2010

Это преобразование XSLT 1.0:

  <xsl:output encoding="utf-8" />

  <!-- the identity template (copies all nodes verbatim, unless
       more specific templates implement different behavior) -->
  <xsl:template match="node()|@*">
      <xsl:apply-templates select="node()|@*" />

  <!-- start by applying templates to all chapter divs -->
  <xsl:template match="xhtml:html">
      <xsl:apply-templates select="xhtml:body/xhtml:div[@class='chapter']" />

  <!-- chapter div: generate heading, apply templates to adjacent h2 -->
  <xsl:template match="xhtml:div[@class='chapter']">
      <xsl:apply-templates select="." mode="heading" />
      <!-- ... where the first preceding chapter div has the same ID -->
      <xsl:apply-templates select="

  <!-- h2: generate heading, apply templates to adjacent paras -->
  <xsl:template match="xhtml:h2[@class='article']">
      <xsl:apply-templates select="." mode="heading" />
      <xsl:apply-templates select="

  <!-- headings follow the same scheme, so we can use a unified template -->
  <xsl:template match="xhtml:div | xhtml:h2" mode="heading">
        <xsl:value-of select="normalize-space(text()[1])" />
        <xsl:value-of select="normalize-space(xhtml:span[@class='number'])" />
        <xsl:value-of select="normalize-space(text()[2])" />

  <xsl:template match="xhtml:p">
      <xsl:apply-templates select="node()" />


применительно к

<html xmlns="http://www.w3.org/1999/xhtml">
    <div class="chapter">Chapter <span class="number">1.1</span> Lorum ipsum</div>
    <h2 class="article">Article <span class="number">1.</span> Lorum ipsum</h2>
    <p>Lorum ipsum A</p>
    <p>Lorum ipsum B</p>
    <h2 class="article">Article <span class="number">2.</span> Lorum ipsum</h2>
    <p>Lorum ipsum D</p>
    <h2 class="article">Article <span class="number">3.</span> Lorum ipsum</h2>
    <p>Lorum ipsum E</p>
    <p>Lorum ipsum F</p>
    <div class="chapter">Chapter <span class="number">2.1</span> Lorum ipsum</div>
    <h2 class="article">Article <span class="number">1.</span> Lorum ipsum</h2>
    <p>Lorum ipsum G</p>


      <title>Lorum ipsum</title>
        <title>Lorum ipsum</title>
      <par>Lorum ipsum A</par>
      <par>Lorum ipsum B</par>
        <title>Lorum ipsum</title>
      <par>Lorum ipsum D</par>
        <title>Lorum ipsum</title>
      <par>Lorum ipsum E</par>
      <par>Lorum ipsum F</par>
      <title>Lorum ipsum</title>
        <title>Lorum ipsum</title>
      <par>Lorum ipsum G</par>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.