Пример содержимого файла: -
<DT><A HREF="http://www.cnn.com/" ADD_DATE="1299885544">CNN</A>
<DT><A HREF="http://www.nytimes.com/" ADD_DATE="1299885544">The New York Times</A>
<DT><A HREF="feed://news.google.com/?output=rss" ADD_DATE="1299885544">Google News</A>
<DT><A HREF="http://www.news.com/" ADD_DATE="1299885544">CNET News.com</A>
<DT><A HREF="http://espn.go.com/" ADD_DATE="1299885544">ESPN</A>
Код, который я использую: -
path = File.join(directory, bookmark.file_file_name)
file = Nokogiri::HTML(open(path))
count = 1
file.search('//*[@href]').each do |m|
p m
p m[:href]
rescue
next
end
end
O / p для вышеуказанного кода: -
p m
<Nokogiri::XML::Element:0x81dbed64 name="a" attributes=[#<Nokogiri::XML::Attr:0x81dbe120 name="href" value="http://maps.google.com/">, #<Nokogiri::XML::Attr:0x81dbe0e4 name="add_date" value="1299885544">] children=[#<Nokogiri::XML::Text:0x81db3590 "Google Maps">]>
pm [: href]
http://maps.google.com/
Я хочу иметь как URL, так и его значение. например, "feed: //news.google.com/? output = rss" и "Новости Google"