Лучший способ прочитать пространство имен из потока XML (используя Java) - PullRequest
2 голосов
/ 11 мая 2011

Мне было интересно, если бы у людей было какое-то мнение по поводу следующего.

У меня есть такие сегменты XML:

<?xml version="1.0" encoding="UTF-8"?>
<clashes:MatchingElementAndAttribute xmlns:clashes="http://example.com/AttribElemClashes" clash="123">
        <clash>strval</clash>
</clashes:MatchingElementAndAttribute>

И я хочу иметь возможность извлечь пространство имен фрагмента XML.

Каков наилучший способ сделать это (в Java) - и самый эффективный.

Спасибо за любую помощь и предложения

Роб

Ответы [ 3 ]

2 голосов
/ 11 мая 2011

Вы можете использовать синтаксический анализатор stax, например woodstox, так как он будет хорошо работать даже с большими XML-файлами.Он загружает XML как поток, и вы получите событие для запуска элемента.Он также предоставляет способ получить QName (квалифицированное имя) элемента в виде объекта, который также имеет пространство имен, доступное в качестве свойства.

Посмотрите на http://www.xml.com/pub/a/2003/09/17/stax.html

2 голосов
/ 12 октября 2011

чтение XML, использующего пространства имен. Пожалуйста, используйте следующий код точно, без каких-либо небольших изменений.

<?xml version="1.0" encoding="UTF-8" standalone="no"?><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:aapi="http://rdf.alchemyapi.com/rdf/v1/s/aapi-schema#" xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#" xmlns:owl="http://www.w3.org/2002/07/owl#" xml:base="http://rdf.alchemyapi.com/rdf/v1/r/response.rdf">
<rdf:Description rdf:ID="d1dfa235105c033dec6dffdff63239d8b802087d9">
    <rdf:type rdf:resource="http://rdf.alchemyapi.com/rdf/v1/s/aapi-schema#DocInfo"/>
    <aapi:ResultStatus>OK</aapi:ResultStatus>
    <aapi:Usage>By accessing AlchemyAPI or using information generated by AlchemyAPI, you are agreeing to be bound by the AlchemyAPI Terms of Use: http://www.alchemyapi.com/company/terms.html</aapi:Usage>
    <aapi:URL/>
    <aapi:Language>english</aapi:Language>
</rdf:Description>
<rdf:Description >

    <aapi:Relevance>0.9683</aapi:Relevance>
    <aapi:Name>Access control</aapi:Name>
        <owl:sameAs rdf:resource="http://dbpedia.org/resource/Access_control"/>
        <owl:sameAs rdf:resource="http://rdf.freebase.com/ns/guid.9202a8c04000641f8000000000051124"/>
</rdf:Description>

для приведенного выше XML, вы можете просто использовать следующий хороший код Java. Я предлагаю вам больше не искать в Google, прежде чем самостоятельно проверять этот код:

import javax.xml.parsers.*;

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        factory.setNamespaceAware(true);

        DocumentBuilder docBuilder = factory.newDocumentBuilder();

   org.w3c.dom.Document  doc = docBuilder.parse(new InputSource(new StringReader(strAbstractRdf))); 

   NodeList nl = doc.getElementsByTagNameNS("*","Description");    //the tag name

   for (int kk=0;kk< nl.getLength(); kk++)
   {
         Node eDes = nl.item(kk);
         if(eDes.getNodeType() == Node.ELEMENT_NODE)
         {

             Element eDescrition = (Element)eDes;
             NodeList nlTermName= eDescrition.getElementsByTagNameNS("*","Relevance");
             if(nlTermName.getLength() > 0)
             {
                 Element eTermName =(Element) nlTermName.item(0);
                 System.out.println(eTermName.getTextContent());
             }

         }



   }
0 голосов
/ 11 мая 2011

Вы не должны видеть здесь столкновение, тот факт, что ваш атрибут и дочерний элемент на самом деле называются "столкновение", действительно не должно быть проблемой.

У вас вообще есть работающий парсер?Есть ли у вас трудности с этим, например, создание исключений, неспособность сделать то, что вы ожидаете?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...