HTML-анализ Nokogiri не работает - PullRequest
       10

HTML-анализ Nokogiri не работает

1 голос
/ 07 сентября 2011

Я пытаюсь разобрать HTML-код с помощью Nokogiri, но я ничего не получаю от методов css или xpath.

require 'rubygems'
require 'open-uri'
require 'nokogiri'

doc = Nokogiri::HTML(open("http://www.google.com"))
doc.css('div').each do |div|
   puts div.content
end
doc.xpath('//div').each do |div|
   puts div.content
end

На экран ничего не выводится, поэтому css и xpath возвращают пустые массивы. На главной странице Google не менее 100 дел.

doc.to_html возвращает:

<!DOCTYPE html>\n\n

doc.validate возвращает:

[#<Nokogiri::XML::SyntaxError: no root element>]

Я удалил Nokogiri и переустановил libxml2 и libxslt, как упоминалось в « Установка Nokogiri ». Все работает сейчас.

...