Проблема: у нас есть символьные объекты, поступающие в наши системы в различных форматах (например: &
и &
), и нам необходимо преобразовать их в стандартные символьные объекты XML, если необходимо (& < > ' "
), а затем поддерживать их как сущности через пару отдельных преобразований.
Данный XML из:
<rootelm>
<testdata>&apos; &gt; &lt; &quot;</testdata>
</rootelm>
и таблица стилей (на основе xsl: таблица символов для замены специальных символов ):
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="2.0">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>
<!-- COPY EVERYTHING -->
<xsl:template match="node() | @*">
<xsl:copy>
<xsl:apply-templates select="@* | node()">
<xsl:sort select="local-name()"/>
</xsl:apply-templates>
</xsl:copy>
</xsl:template>
<xsl:variable name="quote">
<xsl:text>&quot;</xsl:text>
</xsl:variable>
<xsl:variable name="quote2">
<xsl:value-of select="string('"')"/>
</xsl:variable>
<xsl:template match="text()[contains(.,'&lt;') or contains(.,'&gt;') or contains(.,'&quot;') or contains(.,'&apos;')]">
<xsl:value-of select='replace(
replace(
replace(
replace(., "&lt;", "<"),
"&gt;",
">"
),
"&apos;",
"'"
),
$quote,
$quote2
)
' />
</xsl:template>
</xsl:stylesheet>
Как сохранить апострофы и цитаты как сущности (исходная система ожидает / нуждается в них)?
Токовый выход:
<rootelm>
<testdata>' > < "</testdata>
</rootelm>