Оба XPath / getChildElements не смогли получить дочерний XML в XOM - PullRequest
3 голосов
/ 15 августа 2011

Я должен проанализировать XML-файл OAI-PMH, который выглядит следующим образом.Я хотел бы перебрать все узлы <record> в ListRecord.

<?xml version="1.0" encoding="UTF-8"?>
<OAI-PMH xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd" xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
  <responseDate>2010-12-30T10:46:39.654+08:00</responseDate>
  <request verb="ListRecords" metadataPrefix="oai_dc">http://172.16.1.118/ahd/oai2.do</request>
  <ListRecords>
    <record>
      <header>
        <identifier>9010402101001001</identifier>
      </header>
      <metadata>
        <oai_dc:dc xsi:schemaLocationfiltered="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/">
          <dc:identifier>9010402101001001</dc:identifier>
        </oai_dc:dc>
      </metadata>
    </record>
    <resumptionToken>1509/1509</resumptionToken>
  </ListRecords>
</OAI-PMH>

Но когда я использую XOM 1.2.5 для получения этих узлов, независимо от того, какой метод я использую (query или getChildElements), он всегда возвращает0 узлов.

Ниже приведен код, который я использую в интерпретаторе Scala:

scala> import nu.xom.Builder
import nu.xom.Builder

scala> val builder = new Builder
builder: nu.xom.Builder = nu.xom.Builder@6682d439

scala> val document = builder.build(new java.io.File("/home/brianhsu/qqq.xml"))
document: nu.xom.Document = [nu.xom.Document: OAI-PMH]

scala> document.query("//record").size
res0: Int = 0

scala> document.query("//ListRecords").size
res1: Int = 0

scala> document.getRootElement.getChildElements("ListRecords").size
res2: Int = 0

Я понятия не имею, почему я не могу получить ListRecords и record в XML.Я что-то пропустил?

Ответы [ 2 ]

3 голосов
/ 15 августа 2011

Я обнаружил, что это дубликат Выражение XPath ничего не возвращает для // элемента, но // * возвращает счетчик

Следующий код работает, мне нужно связать имя тегав пространство имен.

scala> val context = new XPathContext("xsi", "http://www.openarchives.org/OAI/2.0/")
context: nu.xom.XPathContext = nu.xom.XPathContext@19a3f495

scala> document.query("//xsi:record", context).size
res6: Int = 1
2 голосов
/ 15 августа 2011

Держу пари, что это проблема xmlns - вы пытались использовать параметр домена? Попробуйте:

 document.getRootElement
         .getChildElements("ListRecords", 
                           "http://www.openarchives.org/OAI/2.0/").size

По сути, многим языкам, когда для объекта XML заданы значения по умолчанию ns, потребуется это пространство имен для поиска этого узла - даже если он не имеет префикса в самом выводимом DOM.

(Это также можно сделать с помощью объекта XPathContext, как показано Брайаном Хсу)

...