В ruby, как я могу удалить несловесные символы? - PullRequest
0 голосов
/ 04 марта 2012

этот скрипт является частью большего, когда я запускаю этот скрипт, я также получаю распечатку "<p></p>". Как я могу удалить это?

Я использовал это регулярное выражение: m.gsub!(/(?=\S)(\d|\W)/,"")

Но он удалил только символы "<" и "/>"

Вот мой сценарий:

require 'open-uri'
require 'rexml/document'
include REXML

doc = REXML::Document.new(open('http://testnavet.skolverket.se/SusaNavExport/EmilObjectExporter?id=184594606&amp;strId=info.uh.gu.GS5&amp;EMILVersion=1.1').read)

doc.elements.each("//*[name()='ct:text'] | /ns:educationInfo/ns:extensionInfo/gu:guInfoExtensions/gu:guSubject/gu:descriptions/gu:description"){
          |e| m = e.text 
              puts "Description: " + m  
        }

1 Ответ

1 голос
/ 04 марта 2012

Ах, вы хотите удалить HTML-теги.Если так, вы можете сделать это:

str.gsub(/<.+?>/, "")

Таким образом, "

Hello world!
" становится "Hello world"
...