Я пытаюсь запустить следующий код, где я использую nokogiri для анализа xml-файла.Я хочу исключить символы новой строки из текста, содержащегося между тегами.Код, который я здесь использовал, раньше работал, но по какой-то причине сейчас не работает.Возможно, потому что я обновился до ruby-1.9.1.
titles = node.search('b')
titles.each do |e|
unless e.parent.name == "h4"
if e.children.children.first.nil? == false
puts e.children.children.first.text.gsub("\n","")
end
end
end
Когда я запускаю код, я получаю эту ошибку:
HI. You're using libxml2 version 2.6.16 which is over 4 years old and has
plenty of bugs. We suggest that for maximum HTML/XML parsing pleasure, you
upgrade your version of libxml2 and re-install nokogiri. If you like using
libxml2 version 2.6.16, but don't like this warning, please define the constant
I_KNOW_I_AM_USING_AN_OLD_AND_BUGGY_VERSION_OF_LIBXML2 before requring nokogiri.
test.rb:35:in `gsub': invalid byte sequence in UTF-8 (ArgumentError)