выбор нескольких тегов xpath - PullRequest
3 голосов
/ 30 июня 2011

Для данного XML, как я могу выбрать c, d, g, h (которые будут дочерними тегами b, а не j), используя xpath?

XML

<a>
 <b>
  <c>select me</c>
  <d>select me</d>
  <e>do not select me</e>
  <f>
    <g>select me</g>
    <h>select me</h>
  </f>
 </b>

 <j>
  <c>select me</c>
  <d>select me</d>
  <e>do not select me</e>
  <f>
    <g>select me</g>
    <h>select me</h>
  </f>
 </j>
</a>

Iподумал об использовании следующего, чтобы получить результат, но он не дает мне значения g, h

xpath.compile("//a/b/*[self::c or self::d or self::f/text()");

Java-код, который я использовал

import org.w3c.dom.*;
import javax.xml.xpath.*;
import javax.xml.parsers.*;
import java.io.IOException;
import org.xml.sax.SAXException;

 public class XPathDemo {

   public static void main(String[] args) 
   throws ParserConfigurationException,SAXException,IOException,PathExpressionException {

   DocumentBuilderFactory domFactory = 
   DocumentBuilderFactory.newInstance();
   domFactory.setNamespaceAware(true); 
   DocumentBuilder builder = domFactory.newDocumentBuilder();
   Document doc = builder.parse("test.xml");
   XPath xpath = XPathFactory.newInstance().newXPath();

   XPathExpression expr = xpath.compile("//a/b/*[self::c or self::d or self::f]/text()");

  Object result = expr.evaluate(doc, XPathConstants.NODESET);
  NodeList nodes = (NodeList) result;
    for (int i = 0; i < nodes.getLength(); i++) {
        System.out.println(nodes.item(i).getNodeValue()); 
   }
}

}

Может кто-нибудьпомогите мне с этим?

Спасибо большое !!!

Ответы [ 3 ]

7 голосов
/ 30 июня 2011

Используйте этот xpath, если вы хотите выбрать все узлы c, d, g, h:

"//c|//d|//g|//h"

Используйте это, если вы хотите указать полный путь от корня:

"/a/b/c|/a/b/d|/a/b/f/g|/a/b/f/h"

Или, если вы хотите, чтобы все c, d, g или h находились в пределах b:

"//b//c|//b//d|//b//g|//b//h"

Кроме того, в вашем коде: используйте nodes.item(i).getTextContent() вместо GetNodeValue.

3 голосов
/ 30 июня 2011

Используйте :

 //a/b/*[not(self::e or self::f)]
|
 //a/b/*/*[self::g or self::h]

Если вы хорошо знаете структуру XML-документа , и это правда, что единственные внуки, которые //a/b может иметь g и / или h, тогда это можно упростить до:

 //a/b/*[not(self::e or self::f)]
|
 //a/b/*/*

В XPath 2.0 это можно записать еще проще как:

 //a/b/(*[not(self::e or self::f)] | */*)
3 голосов
/ 30 июня 2011

как выбрать c, d, g, h (которые будут дочерними тегами b, а не j), используя xpath ?

XPath 2.0

"/a/b//*[matches(name(),'^c$|^d$|^g$|^h$')]"

Чтобы остаться с вашим исходным путем, XPath 1.0 должно быть:

"/a/b//*[name()='c' 
  or name()='d' 
  or name()='g' 
  or name()='h']"

Или,после использования оси:

 "/a/b//*[self::c 
  or self::d 
  or self::g 
  or self::h]"

Добавив пути к местоположению выше text(), вы получите текстовый узел от каждого связанного тега.

PS: решение, заданное @пять должен быть изменен на /a/b/c|/a/b/d|/a/b/f/g|/a/b/f/h.

...