этот скрипт является частью большего, когда я запускаю этот скрипт, я также получаю распечатку "<p></p>". Как я могу удалить это?
<p></p>
Я использовал это регулярное выражение: m.gsub!(/(?=\S)(\d|\W)/,"")
m.gsub!(/(?=\S)(\d|\W)/,"")
Но он удалил только символы "<" и "/>"
Вот мой сценарий:
require 'open-uri' require 'rexml/document' include REXML doc = REXML::Document.new(open('http://testnavet.skolverket.se/SusaNavExport/EmilObjectExporter?id=184594606&strId=info.uh.gu.GS5&EMILVersion=1.1').read) doc.elements.each("//*[name()='ct:text'] | /ns:educationInfo/ns:extensionInfo/gu:guInfoExtensions/gu:guSubject/gu:descriptions/gu:description"){ |e| m = e.text puts "Description: " + m }
Ах, вы хотите удалить HTML-теги.Если так, вы можете сделать это:
str.gsub(/<.+?>/, "")
Таким образом, "