groovy XmlSlurper не разбирает мой xml файл - PullRequest
2 голосов
/ 04 декабря 2009

У меня есть xml, и я не могу разобрать этот файл с помощью xmlslurper. Вот копия моего XML-файла:

<Entrezgene-Set>
<Entrezgene>
<Entrezgene_summary>The protein encoded by this gene is a plasma glycoprotein of unknown function. The protein shows sequence similarity to the variable regions of some immunoglobulin supergene family member proteins. [provided by RefSeq]</Entrezgene_summary>
</Entrezgene>
</Entrezgene-Set>

Мне просто нужно получить текст от <Entrezgene_summary>

Вот мой код:

  def pubmedEfetch = {

  def base = "http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?"
  def qs = []
  qs << "db=gene"
  qs << "id=1"
  qs << "retmode=xml"
  def url = new URL(base + qs.join("&"))
  def connection = url.openConnection()

  def result = [:]

  if(connection.responseCode == 200){
    def xml = connection.content.text
    def eFetchResult = new XmlSlurper().parseText(xml)
    result.geneSummary = eFetchResult.Entrezgene-Set.Entrezgene.Entrezgene_summary
  }
  else{
    log.error("PubmedEfetchParserService.PubmedEsearch FAILED")
    log.error(url)
    log.error(connection.responseCode)
    log.error(connection.responseMessage)
  }
  render result
}

И мое сообщение об ошибке:

Error 500: groovy.lang.MissingPropertyException: No such property: Entrezgene for class: java.util.Set
Servlet: grails
URI: /geneInfo/grails/genes/pubmedEfetch.dispatch
Exception Message: No such property: Entrezgene for class: java.util.Set 
Caused by: groovy.lang.MissingPropertyException: No such property: Entrezgene for class: java.util.Set 
Class: GenesController 

Не понимаю, где моя вина?

Я также пытаюсь: result.geneSummary = eFetchResult./Entrezgene-Set/.Entrezgene.Entrezgene_summary

У кого-то есть идея? Спасибо

Ответы [ 2 ]

5 голосов
/ 05 декабря 2009

Вам не нужно разыменовывать верхний тег (Entersgene-Set>). У меня в groovyconsole работает следующее:

xml = """<Entrezgene-Set>
<Entrezgene>
   <Entrezgene_summary>The protein encoded by this gene is a plasma glycoprotein of unknown function. The protein shows sequence similarity to the variable regions of some immunoglobulin supergene family member proteins. [provided by RefSeq]
   </Entrezgene_summary>
</Entrezgene>
</Entrezgene-Set>
"""


def eFetchResult = new XmlSlurper().parseText(xml)
x = eFetchResult.Entrezgene.Entrezgene_summary
println "x is [${x}]"

Кстати, ваше сообщение об ошибке вызвано попыткой использовать имя свойства с дефисом в нем.

2 голосов
/ 05 декабря 2009

Спасибо, Я просто исправляю вашу проблему с вашей помощью:

  • с использованием кавычек, если в моем элементе xml есть дефис (например: result.test = eFetchResult.Entrezgene.'Entrezgene_track-info '.' Gene-track '.' Gene-track_geneid '),
  • при удалении - ссылка на верхний тег (если я сохраню ссылку на верхний тег, значения моей карты будут пусты - полезно знать, что: -)

Вот мое исправление:

  def pubmedEfetch = {

  def base = "http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?"
  def qs = []
  qs << "db=gene"
  qs << "id=1"
  qs << "retmode=xml"
  def url = new URL(base + qs.join("&"))
  def connection = url.openConnection()

  def result = [:]

  if(connection.responseCode == 200){
    def xml = connection.content.text
    def eFetchResult = new XmlSlurper().parseText(xml)
    result.geneSummary = eFetchResult.Entrezgene.Entrezgene_summary
  }
  else{
    log.error("PubmedEfetchParserService.PubmedEsearch FAILED")
    log.error(url)
    log.error(connection.responseCode)
    log.error(connection.responseMessage)
  }
  render result
}
...