XmlSlurper - список текстовых и обычных узлов документа xhtml - PullRequest
3 голосов
/ 29 мая 2009

Я использую Groovy XmlSlurper для разбора документа xhtml (или sudo xhthml), и я пытаюсь добраться до текстовых узлов документа, но не могу понять, как, вот код:

import groovy.util.*

xmlText = '''
<TEXTFORMAT INDENT="10" LEADING="-5">
  <P ALIGN="LEFT">
    <FONT FACE="Garamond Premr Pro" SIZE="20" COLOR="#001200" LETTERSPACING="0" KERNING="0">
      Less is more! this 
      <FONT COLOR="#FFFF00">should be all</FONT>
      the 
      <FONT COLOR="#00FF00"> words OR should some </FONT>
      OTHER WORDS will be there?
    </FONT>
  </P>
</TEXTFORMAT>
'''
records = new XmlSlurper().parseText(xmlText)
records.P.FONT.children().eachWithIndex {it, index -> println "${index} - ${it}"} 

Какой выводится следующий вывод:

0 - should be all 
1 -  words OR should some

Но я хочу, чтобы он также печатал содержимое текстовых узлов, поэтому желаемый вывод:

0 - Less is more! this
1 - should be all
2 - the 
3 - words OR should some
4 - OTHER WORDS will be there?

Есть идеи?

1 Ответ

4 голосов
/ 30 мая 2009

Похоже, у XmlSlurper нет отдельного метода для извлечения "смешанного контента"

Здесь есть открытый элемент для добавления метода с поддержкой смешанного контента -> Groovy JIRA

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...