Я пытаюсь разобрать HTML-код с помощью Nokogiri, но я ничего не получаю от методов css
или xpath
.
require 'rubygems'
require 'open-uri'
require 'nokogiri'
doc = Nokogiri::HTML(open("http://www.google.com"))
doc.css('div').each do |div|
puts div.content
end
doc.xpath('//div').each do |div|
puts div.content
end
На экран ничего не выводится, поэтому css
и xpath
возвращают пустые массивы. На главной странице Google не менее 100 дел.
doc.to_html
возвращает:
<!DOCTYPE html>\n\n
doc.validate
возвращает:
[#<Nokogiri::XML::SyntaxError: no root element>]
Я удалил Nokogiri и переустановил libxml2 и libxslt, как упоминалось в « Установка Nokogiri ». Все работает сейчас.