Лучший способ для анализа различных пользовательских документов XML в Java - PullRequest
7 голосов
/ 22 августа 2008

Каков наилучший метод для анализа нескольких отдельных XML-документов с помощью Java?

Ответы [ 6 ]

5 голосов
/ 22 августа 2008

Я бы использовал Stax для разбора XML, это быстро и просто в использовании. Я использовал его в моем последнем проекте для анализа XML-файлов размером до 24 МБ. На java.net есть хорошее введение, которое расскажет вам все, что вам нужно знать, чтобы начать работу.

4 голосов
/ 07 декабря 2010

По сути, у вас есть два основных метода синтаксического анализа XML в Java:

  • SAX , где вы используете обработчик , чтобы получить только то, что вы хотите в вашем XML, и отбросить остальные
  • DOM , который анализирует ваш файл все время и позволяет вам захватывать все элементы более древовидным способом.

Еще один очень полезный метод синтаксического анализа XML, хотя и несколько более поздний, чем эти, и включенный в JRE только после Java6, - это StAX . StAX был задуман как медиальный метод между основанным на дереве DOM и основанным на событиях подходом SAX. Он очень похож на SAX в том, что анализ очень больших документов прост, но в этом случае приложение «извлекает» информацию из анализатора, а не анализирует «проталкивание» событий в приложение. Вы можете найти больше объяснений на эту тему здесь .

Таким образом, в зависимости от того, чего вы хотите достичь, вы можете использовать один из этих подходов.

3 голосов
/ 22 августа 2008

Вы хотите использовать org.xml.sax.XMLReader (http://docs.oracle.com/javase/7/docs/api/org/xml/sax/XMLReader.html).

2 голосов
/ 14 марта 2011

Используйте библиотеку dom4j

Сначала прочитайте документ

import java.net.URL;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;

public class Foo {

    public Document parse(URL url) throws DocumentException {
        SAXReader reader = new SAXReader();
        Document document = reader.read(url);
        return document;
    }
}

Затем используйте XPATH, чтобы получить нужные вам значения

public void get_author(Document document) {
    Node node = document.selectSingleNode( "//AppealRequestProcessRequest/author" );
    String author = node.getText();
    return author;
}
2 голосов
/ 14 марта 2011

Если вам нужно только разобрать, я бы порекомендовал использовать библиотеку XPath. Вот хорошая ссылка: http://www.ibm.com/developerworks/library/x-javaxpathapi.html

Но вы можете рассмотреть возможность превращения XML в объекты, и тогда пределом является небо. Для этого вы можете использовать XStream , это отличная библиотека, которую я использую много

0 голосов
/ 24 марта 2016

Ниже приведен код извлечения некоторого значения значения с использованием vtd-xml .

import com.ximpleware.*;

public class extractValue{
    public static void  main(String s[]) throws VTDException, IOException{
        VTDGen vg = new VTDGen();
        if (!vg.parseFile("input.xml", false));
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        ap.selectXPath("/aa/bb[name='k1']/value");
        int i=0;
        while ((i=ap.evalXPath())!=-1){
            System.out.println(" value ===>"+vn.toString(i));
        }   
    }
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...