Объединение документов при сохранении xsi: type - PullRequest
5 голосов
/ 01 июня 2011

У меня есть 2 объекта Document с документами, которые содержат аналогичные XML. Например:

<tt:root xmlns:tt="http://myurl.com/">
  <tt:child/>
  <tt:child/>
</tt:root>

А другой:

<ns1:root xmlns:ns1="http://myurl.com/" xmlns:ns2="http://myotherurl.com/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
  <ns1:child/>
  <ns1:child xsi:type="ns2:SomeType"/>
</ns1:root>

Мне нужно объединить их в 1 документ с 1 корневым элементом и 4 дочерними элементами. Проблема в том, что если я использую функцию document.importNode для объединения, она правильно обрабатывает пространства имен везде, НО элемент xsi: type. В результате я получаю следующее:

<tt:root xmlns:tt="http://myurl.com/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
  <tt:child/>
  <tt:child/>
  <ns1:child xmlns:ns1="http://myurl.com/"/>
  <ns1:child xmlns:ns1="http://myurl.com/" xsi:type="ns2:SomeType"/>
</tt:root>

Как видите, ns2 используется в xsi:type, но нигде не определен. Есть ли какой-нибудь автоматизированный способ решения этой проблемы?

Спасибо.

ДОБАВЛЕНО:

Если эту задачу невозможно выполнить с помощью стандартных библиотек java DOM, возможно, есть какая-то другая библиотека, которую я могу использовать для выполнения своей задачи?

Ответы [ 6 ]

2 голосов
/ 06 июня 2011

Проблема здесь заключается в использовании префиксов пространства имен в значениях атрибутов;то, что никогда не учитывалось при создании стандарта пространства имен, и то, что обычные инструменты Java DOM / XML не могут легко обработать.Тем не менее, вы можете решить ее с помощью

  1. Перед объединением замените каждый экземпляр xsi:type="prefix:value" на xsi:type="{namespace}value".Делая это, вы не зависите от сопоставления префиксов.В вашем примере <xsi:type="ns2:SomeType" станет xsi:type="{http://myotherurl.com/}SomeType".
  2. Объединить документы.
  3. В результирующем документе отмените замену на шаге 1. Необходимо тщательно управлять сопоставлениями префиксов, чтобыизбегать столкновений;возможно, необходимо создать новое отображение.
2 голосов
/ 01 июня 2011

Если я исправлю проблему пространства имен во втором файле (связав префикс "xsi"), и выполню слияние, используя код ниже, привязки пространства имен сохранятся в выходных данных;или, по крайней мере, они здесь (ванильная Java 64-bit в Windows build 1.6.0_24).

String s1 = "<!-- 1st XML document here -->";
String s2 = "<!-- 2nd XML document here -->";

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
factory.setNamespaceAware( true );
DocumentBuilder builder = factory.newDocumentBuilder();

Document doc1 = builder.parse( new ByteArrayInputStream( s1.getBytes() ) );
Document doc2 = builder.parse( new ByteArrayInputStream( s2.getBytes() ) );

Element doc1root = ( Element )doc1.getDocumentElement();
Element doc2root = ( Element )doc2.getDocumentElement();

NamedNodeMap atts1 = doc1root.getAttributes();
NamedNodeMap atts2 = doc2root.getAttributes();

for( int i = 0; i < atts1.getLength(); i++ )
{
    String name = atts1.item( i ).getNodeName();
    if( name.startsWith( "xmlns:" ) )
    {
        if( atts2.getNamedItem( name ) == null )
        {
            doc2root.setAttribute( name, atts1.item( i ).getNodeValue() );
        }    
    }    
}

NodeList nl = doc1.getDocumentElement().getChildNodes();
for( int i = 0; i < nl.getLength(); i++ )
{
    Node n = nl.item( i );
    doc2root.appendChild( doc2.importNode( n, true ) );

}

TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
StreamResult streamResult = new StreamResult( System.out );
transformer.transform( new DOMSource( doc2 ), streamResult );
1 голос
/ 09 июня 2011

Одну строку из XQuery можно выполнить: создать новый узел с именем корневого элемента контекста, а затем импортировать его дочерние элементы вместе с дочерними элементами из другого документа:

declare variable $other external; element {node-name(*)} {*/*, $other/*/*}

Хотя в XQuery у вас нет полного контроля над узлами пространства имен (по крайней мере, в XQuery 1.0), он имеет параметр режима copy-namespaces, который можно использовать для запроса сохранения целостности контекста пространства имен в случае, если реализация сохраняет его по умолчанию.

Если XQuery является жизнеспособным вариантом, тогда saxon9he.jar может быть "волшебной библиотекой xml", к которой вы стремитесь.

Вот пример кода, представляющего некоторый контекст с использованием s9api API :

import javax.xml.parsers.DocumentBuilderFactory;
import net.sf.saxon.s9api.*;
import org.w3c.dom.Document;

...

  Document merge(Document context, Document other) throws Exception
  {
    Processor processor = new Processor(false);
    XQueryExecutable executable = processor.newXQueryCompiler().compile(
      "declare variable $other external; element {node-name(*)} {*/*, $other/*/*}");
    XQueryEvaluator evaluator = executable.load();    
    DocumentBuilder db = processor.newDocumentBuilder();
    evaluator.setContextItem(db.wrap(context));
    evaluator.setExternalVariable(new QName("other"), db.wrap(other));
    Document doc =
      DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument();
    processor.writeXdmValue(evaluator.evaluate(), new DOMDestination(doc));
    return doc;
  }
1 голос
/ 06 июня 2011

UPDATE

Это не будет работать для случая, когда два документа столкнулись префиксы пространства имен (отображение из второй документ заменит отображение с первого раза).

Вы можете скопировать объявления пространства имен из второго документа в импортированные узлы. Поскольку дочерние узлы могут переопределять префикс родительских узлов, это допустимо:

<foo:root xmlns:foo="urn:ROOT">
    <foo:child xmlns:foo="urn:CHILD" xsi:type="foo:child-type">
       ...
    </foo:child>
</foo:root>

В приведенном выше XML-коде пространство имен, привязанное к префиксу "foo", переопределяется в области действия дочернего элемента. Вы можете выполнить это для своего варианта использования, выполнив следующие действия:

import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Attr;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class Demo {

    public static void main(String[] args) throws Exception  {
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        dbf.setNamespaceAware(true);
        DocumentBuilder db = dbf.newDocumentBuilder();

        File file1 = new File("src/forum231/input1.xml");
        Document doc1 = db.parse(file1);
        Element rootElement1 = doc1.getDocumentElement();

        File file2 = new File("src/forum231/input2.xml");
        Document doc2 = db.parse(file2);
        Element rootElement2 = doc2.getDocumentElement();

        // Copy Child Nodes
        NodeList childNodes2 = rootElement2.getChildNodes();
        for(int x=0; x<childNodes2.getLength(); x++) {
            Node importedNode = doc1.importNode(childNodes2.item(x), true);
            if(importedNode.getNodeType() == Node.ELEMENT_NODE) {
                Element importedElement = (Element) importedNode;
                // Copy Attributes
                NamedNodeMap namedNodeMap2 = rootElement2.getAttributes();
                for(int y=0; y<namedNodeMap2.getLength(); y++) {
                    Attr importedAttr = (Attr) doc1.importNode(namedNodeMap2.item(y), true);
                    importedElement.setAttributeNodeNS(importedAttr);
                }
            }
            rootElement1.appendChild(importedNode);
        }

        // Output Document
        TransformerFactory tf = TransformerFactory.newInstance();
        Transformer t = tf.newTransformer();
        DOMSource source = new DOMSource(doc1);
        StreamResult result = new StreamResult(System.out);
        t.transform(source, result);
    }

}

выход

<?xml version="1.0" encoding="UTF-8" standalone="no"?><tt:root xmlns:tt="http://myurl.com/">
  <tt:child/>
  <tt:child/>

  <ns1:child xmlns:ns1="http://myurl.com/" xmlns:ns2="http://myotherurl.com/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"/>
  <ns1:child xmlns:ns1="http://myurl.com/" xmlns:ns2="http://myotherurl.com/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:type="ns2:SomeType"/>
</tt:root>
<Ч />

ОРИГИНАЛЬНЫЙ ОТВЕТ

Помимо копирования элементов, вы можете копировать атрибуты. Это обеспечит, чтобы полученный документ содержал необходимые объявления пространства имен:

import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Attr;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class Demo {

    public static void main(String[] args) throws Exception  {
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        dbf.setNamespaceAware(true);
        DocumentBuilder db = dbf.newDocumentBuilder();

        File file1 = new File("input1.xml");
        Document doc1 = db.parse(file1);
        Element rootElement1 = doc1.getDocumentElement();

        File file2 = new File("input2.xml");
        Document doc2 = db.parse(file2);
        Element rootElement2 = doc2.getDocumentElement();

        // Copy Attributes
        NamedNodeMap namedNodeMap2 = rootElement2.getAttributes();
        for(int x=0; x<namedNodeMap2.getLength(); x++) {
            Attr importedNode = (Attr) doc1.importNode(namedNodeMap2.item(x), true);
            rootElement1.setAttributeNodeNS(importedNode);
        }

        // Copy Child Nodes
        NodeList childNodes2 = rootElement2.getChildNodes();
        for(int x=0; x<childNodes2.getLength(); x++) {
            Node importedNode = doc1.importNode(childNodes2.item(x), true);
            rootElement1.appendChild(importedNode);
        }

        // Output Document
        TransformerFactory tf = TransformerFactory.newInstance();
        Transformer t = tf.newTransformer();
        DOMSource source = new DOMSource(doc1);
        StreamResult result = new StreamResult(System.out);
        t.transform(source, result);
    }

}

Выход:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<tt:root xmlns:tt="http://myurl.com/" xmlns:ns1="http://myurl.com/" xmlns:ns2="http://myotherurl.com/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
  <tt:child/>
  <tt:child/>

  <ns1:child/>
  <ns1:child xsi:type="ns2:SomeType"/>
</tt:root>
1 голос
/ 06 июня 2011

Я бы взял JAXB и подключаемый модуль Mergeable для генерации mergeFrom методов в классах, производных от схемы. Тогда:

  • Умаршал о1, о2
  • Мардж o1, o2 с использованием сгенерированных методов в o3
  • Маршал о3

JAXB нормально обрабатывает xsi:type вполне нормально.

0 голосов
/ 20 апреля 2012

Если вы знаете, что URI пространства имен и префикс URI, который вы хотите добавить, может быть таким же простым, как простое добавление атрибута к элементу. Это работало для меня, когда в моем объединенном документе отсутствовал xmlns: xsd = "http://www.w3.org/2001/XMLSchema", содержащийся в моем импортированном документе:

    myDocument.getDocumentElement.setAttribute("xmlns:xsd", "http://www.w3.org/2001/XMLSchema");
...