Я пытаюсь сгенерировать XSLT для преобразования XML-файла в формат JSON, включая все необходимые поля для правильной индексации в Solr.
Мой текущий XSLT-файл имеет следующий вид:
<?xml version="1.0"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text"/>
<xsl:template match="/">{
<xsl:apply-templates select="*"/>}
</xsl:template>
<!-- Object or Element Property-->
<xsl:template match="*">
<xsl:variable name="childDoc" select="name(*[1])"/>
<xsl:choose>
<xsl:when test="count(*[name()=$childDoc]) >= 1">
"Document":"<xsl:value-of select="name()"/>", <xsl:call-template name="Properties"/>
</xsl:when>
<xsl:otherwise>
"<xsl:value-of select="name()"/>": <xsl:call-template name="Properties"/>
</xsl:otherwise>
</xsl:choose>
</xsl:template>
<!-- Array Parent Node -->
<xsl:template match="*" mode="ArrayParentNode">
<xsl:call-template name="Path"/>
</xsl:template>
<!-- Array Element -->
<xsl:template match="*" mode="ArrayElement">
<xsl:call-template name="Properties"/>
</xsl:template>
<!-- Object Properties -->
<xsl:template name="Properties">
<xsl:variable name="childName" select="name(*[1])"/>
<xsl:choose>
<xsl:when test="not(*|@*)">"<xsl:value-of select="."/>"</xsl:when>
<xsl:when test="count(*[name()=$childName]) > 1">
"_childDocuments_":[
{ "<xsl:value-of select="$childName"/>" :[<xsl:apply-templates select="*" mode="ArrayElement"/>]
}
]
</xsl:when>
<xsl:otherwise>
"_childDocuments_":[
{
<xsl:apply-templates select="." mode="ArrayParentNode"/>
<xsl:apply-templates select="@*"/>
<xsl:apply-templates select="*"/>
}
]
</xsl:otherwise>
</xsl:choose>
<xsl:if test="following-sibling::*">,</xsl:if>
</xsl:template>
<!-- Attribute Property -->
<xsl:template match="@*">"<xsl:value-of select="name()"/>" : "<xsl:value-of select="."/>",</xsl:template>
<!--Path-->
<xsl:template name = "Path">
<xsl:variable name="ances" select="ancestor-or-self::node()"/>
<xsl:variable name="ancestros">
<xsl:for-each select="$ances">
<xsl:value-of select="concat(name(),'.')"/>
</xsl:for-each>
</xsl:variable>
"Path": "<xsl:value-of select = "substring($ancestros,2,string-length($ancestros)-2)"/>",
</xsl:template>
</xsl:stylesheet>
Учитывая следующий пример:
<Reporte>
<id>10</id>
<Operacion>
<id>10.1</id>
<Tipo_Operacion>Ejemplo</Tipo_Operacion>
<Fecha>10/10/2010</Fecha>
<Monto>12345</Monto>
</Operacion>
<bla>123456ytgfde</bla>
<Persona_Fisica>
<id>10.2</id>
<Nombre>Juan</Nombre>
<Apellido>Perez</Apellido>
<Domicilio>
<id>10.2.1</id>
<Calle>Yrigoyen</Calle>
<Numero>123</Numero>
</Domicilio>
<Telefono>
<id>10.2.2</id>
<Prefijo>11</Prefijo>
<Numero>12345678</Numero>
</Telefono>
</Persona_Fisica>
<Persona_Fisica>
<id>10.3</id>
<Nombre>Roberto Carlos</Nombre>
<Apellido>De Souza</Apellido>
<PEP>true</PEP>
<Domicilio>
<id>10.3.1</id>
<Calle>Falsa</Calle>
<Numero>678</Numero>
</Domicilio>
<Telefono>
<id>10.3.2</id>
<Prefijo>11</Prefijo>
<Numero>87654321</Numero>
</Telefono>
</Persona_Fisica>
<Persona_Juridica>
<id>10.4</id>
<Denominacion>Lavado SRL</Denominacion>
<CUIT>23-32480636-9</CUIT>
</Persona_Juridica>
</Reporte>
Мой вывод следующий:
{
"Document":"Reporte",
"_childDocuments_":[
{
"Path": "Reporte",
"id": "11",
"Document":"Operacion",
"_childDocuments_":[
{
"Path": "Reporte.Operacion",
"id": "10.1",
"Tipo_Operacion": "Ejemplo",
"Fecha": "10/10/2010",
"Monto": "12345"
}
]
,
"bla": "123456ytgfde",
"Document":"Persona_Fisica",
"_childDocuments_":[
{
"Path": "Reporte.Persona_Fisica",
"id": "10.2",
"Nombre": "Juan",
"Apellido": "Perez",
"Document":"Domicilio",
"_childDocuments_":[
{
"Path": "Reporte.Persona_Fisica.Domicilio",
"id": "10.2.1",
"Calle": "Yrigoyen",
"Numero": "123"
}
]
,
"Document":"Telefono",
"_childDocuments_":[
{
"Path": "Reporte.Persona_Fisica.Telefono",
"id": "10.2.2",
"Prefijo": "11",
"Numero": "12345678"
}
]
}
]
,
"Document":"Persona_Fisica",
"_childDocuments_":[
{
"Path": "Reporte.Persona_Fisica",
"id": "10.3",
"Nombre": "Roberto Carlos",
"Apellido": "De Souza",
"PEP": "true",
"Document":"Domicilio",
"_childDocuments_":[
{
"Path": "Reporte.Persona_Fisica.Domicilio",
"id": "10.3.1",
"Calle": "Falsa",
"Numero": "678"
}
]
,
"Document":"Telefono",
"_childDocuments_":[
{
"Path": "Reporte.Persona_Fisica.Telefono",
"id": "10.3.2",
"Prefijo": "11",
"Numero": "87654321"
}
]
}
]
,
"Document":"Persona_Juridica",
"_childDocuments_":[
{
"Path": "Reporte.Persona_Juridica",
"id": "10.4",
"Denominacion": "Lavado SRL",
"CUIT": "23-32480636-9"
}
]
}
]
}
Независимо от отступа (как это желательно, но не обязательно), я ожидал бы что-то вродеследующее:
{
"Document": "Reporte",
"Path": "Reporte",
"id": "12",
"bla": "123456ytgfde",
"_childDocuments_": [
{
"Document": "Operacion",
"Path": "Reporte.Operacion",
"id": "10.1",
"Tipo_Operacion": "Ejemplo",
"Fecha": "10/10/2010",
"Monto": "12345"
},
{
"Document": "Persona_Fisica",
"Path": "Reporte.Persona_Fisica",
"id": "10.2",
"Nombre": "Juan",
"Apellido": "Perez",
"_childDocuments_": [
{
"Document": "Domicilio",
"Path": "Reporte.Persona_Fisica.Domicilio",
"id": "10.2.1",
"Calle": "Yrigoyen",
"Numero": "123"
},
{
"Document": "Telefono",
"Path": "Reporte.Persona_Fisica.Telefono",
"id": "10.2.2",
"Prefijo": "11",
"Numero": "12345678"
}
]
},
{
"Document": "Persona_Fisica",
"Path": "Reporte.Persona_Fisica",
"id": "10.3",
"Nombre": "Roberto Carlos",
"Apellido": "De Souza",
"PEP": "true",
"_childDocuments_": [
{
"Document": "Domicilio",
"Path": "Reporte.Persona_Fisica.Domicilio",
"id": "10.3.1",
"Calle": "Falsa",
"Numero": "678"
},
{
"Document": "Telefono",
"Path": "Reporte.Persona_Fisica.Telefono",
"id": "10.3.2",
"Prefijo": "11",
"Numero": "87654321"
}
]
},
{
"Document": "Persona_Juridica",
"Path": "Reporte.Persona_Juridica",
"id": "10.4",
"Denominacion": "Lavado SRL",
"CUIT": "23-32480636-9"
}
]
}
Подводя итог, что все еще отсутствует в моем XSLT:
- Элементы внутри "Reporte", которые не имеют никаких подэлементов (как "Документ": "Reporte""," Path ":" Reporte "," id ":" 10 "," bla ":" 123456ytgfde ") должны находиться за пределами первого childDocuments элемента.
- Только один childDocuments элемент с несколькими вложенными документами должен быть создан вместо одного для каждого вложенного документа.
- Элемент «Document» должен быть после соответствующего childDocuments вместо before (side)рядом с элементом «Путь», который являетсяхорошо).
- Довольно отступ (просто желательно).