Question

Я использую Groovy XmlSlurper для разбора документа xhtml (или sudo xhthml), и я пытаюсь добраться до текстовых узлов документа, но не могу понять, как, вот код:

import groovy.util.*

xmlText = '''
<TEXTFORMAT INDENT="10" LEADING="-5">
  <P ALIGN="LEFT">
    <FONT FACE="Garamond Premr Pro" SIZE="20" COLOR="#001200" LETTERSPACING="0" KERNING="0">
      Less is more! this 
      <FONT COLOR="#FFFF00">should be all</FONT>
      the 
      <FONT COLOR="#00FF00"> words OR should some </FONT>
      OTHER WORDS will be there?
    </FONT>
  </P>
</TEXTFORMAT>
'''
records = new XmlSlurper().parseText(xmlText)
records.P.FONT.children().eachWithIndex {it, index -> println "${index} - ${it}"}

Какой выводится следующий вывод:

0 - should be all 
1 -  words OR should some

Но я хочу, чтобы он также печатал содержимое текстовых узлов, поэтому желаемый вывод:

0 - Less is more! this
1 - should be all
2 - the 
3 - words OR should some
4 - OTHER WORDS will be there?

Есть идеи?

Kartik Shah · Answer 1 · 30 мая 2009

Похоже, у XmlSlurper нет отдельного метода для извлечения "смешанного контента"

Здесь есть открытый элемент для добавления метода с поддержкой смешанного контента -> Groovy JIRA

XmlSlurper - список текстовых и обычных узлов документа xhtml

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

XmlSlurper - список текстовых и обычных узлов документа xhtml

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов