Снятие меток никогда не повредит;Чем меньше шума, тем лучше.
Вы можете легко получить текст документа без тегов, используя Nokogiri:
require 'nokogiri'
xml = <<EOT
<xml>
<node>This is some text.</node>
<node>This is more text.</node>
</xml>
EOT
doc = Nokogiri::XML(xml)
puts doc.text
>> :!ruby test.rb
>>
>> This is some text.
>> This is more text.
>>
Nokogiri имеет опции для объединения смежных текстовых узлов, но это легко сделать с помощьюобычные манипуляции с Ruby Array и String.