Question

У меня есть полный XML-документ в строке, и мне нужен объект Document. Гугл выворачивает всякую фигню. Какое самое простое решение? (В Java 1.5)

Решение Благодаря Мэтту МакМинну я остановился на этой реализации. Он имеет правильный уровень гибкости ввода и детализации исключений для меня. (Полезно знать, произошла ли ошибка из-за некорректного XML - SAXException - или просто из-за неправильного ввода-вывода - IOException.)

public static org.w3c.dom.Document loadXMLFrom(String xml)
    throws org.xml.sax.SAXException, java.io.IOException {
    return loadXMLFrom(new java.io.ByteArrayInputStream(xml.getBytes()));
}

public static org.w3c.dom.Document loadXMLFrom(java.io.InputStream is) 
    throws org.xml.sax.SAXException, java.io.IOException {
    javax.xml.parsers.DocumentBuilderFactory factory =
        javax.xml.parsers.DocumentBuilderFactory.newInstance();
    factory.setNamespaceAware(true);
    javax.xml.parsers.DocumentBuilder builder = null;
    try {
        builder = factory.newDocumentBuilder();
    }
    catch (javax.xml.parsers.ParserConfigurationException ex) {
    }  
    org.w3c.dom.Document doc = builder.parse(is);
    is.close();
    return doc;
}

erickson · Answer 1 · 29 августа 2008

Стоп!

Существует потенциально серьезная проблема с этим кодом, поскольку он игнорирует кодировку символов, указанную в String (по умолчанию UTF-8). При вызове String.getBytes() кодировка платформы по умолчанию используется для кодирования символов Unicode в байты. Таким образом, синтаксический анализатор может думать, что он получает данные UTF-8, когда на самом деле он получает EBCDIC или что-то еще & hellip; не красиво!

Вместо этого используйте метод синтаксического анализа, который принимает InputSource, который может быть создан с помощью Reader, например так:

import java.io.StringReader;
import org.xml.sax.InputSource;
…
        return builder.parse(new InputSource(new StringReader(xml)));

Это может показаться не таким уж большим делом, но незнание проблем кодировки символов приводит к коварному коду, похожему на y2k.

Matt McMinn · Answer 2 · 29 августа 2008

Это работает для меня в Java 1.5 - я исключил определенные исключения для удобства чтения.

import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.DocumentBuilder;
import org.w3c.dom.Document;
import java.io.ByteArrayInputStream;

public Document loadXMLFromString(String xml) throws Exception
{
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

    factory.setNamespaceAware(true);
    DocumentBuilder builder = factory.newDocumentBuilder();

    return builder.parse(new ByteArrayInputStream(xml.getBytes()));
}

shsteimer · Answer 3 · 05 сентября 2008

Просто была похожая проблема, за исключением того, что мне нужен NodeList, а не Document, вот что я придумал. Это в основном то же решение, что и раньше, с добавлением корневого элемента в качестве NodeList и использованием предложения Эриксона об использовании InputSource вместо проблем кодирования символов.

private String DOC_ROOT="root";
String xml=getXmlString();
Document xmlDoc=loadXMLFrom(xml);
Element template=xmlDoc.getDocumentElement();
NodeList nodes=xmlDoc.getElementsByTagName(DOC_ROOT);

public static Document loadXMLFrom(String xml) throws Exception {
        InputSource is= new InputSource(new StringReader(xml));
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        factory.setNamespaceAware(true);
        DocumentBuilder builder = null;
        builder = factory.newDocumentBuilder();
        Document doc = builder.parse(is);
        return doc;
    }

Xavier Dury · Answer 4 · 05 августа 2014

Чтобы манипулировать XML в Java, я всегда склонен использовать API-интерфейс Transformer:

import javax.xml.transform.Source;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMResult;
import javax.xml.transform.stream.StreamSource;

public static Document loadXMLFrom(String xml) throws TransformerException {
    Source source = new StreamSource(new StringReader(xml));
    DOMResult result = new DOMResult();
    TransformerFactory.newInstance().newTransformer().transform(source , result);
    return (Document) result.getNode();
}

Как загрузить org.w3c.dom.Document из XML в строку?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как загрузить org.w3c.dom.Document из XML в строку?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы