Как мне проанализировать результаты поиска Google с Nokogiri? - PullRequest
7 голосов
/ 16 мая 2011

Мне нужна помощь в извлечении URL из результатов поиска Google, и мне сказали использовать Nokogiri.Я установил его и перечитал документы Nokogiri, но понятия не имею, с чего начать - для меня это все по-гречески.

Я знаю, что я ищу, это URL каждого результата, каждый из которых существует между <cite> тег.До сих пор все, что мне удалось выяснить, как это сделать, это получить результаты поиска, но я просто не знаю, как извлечь определенные данные из файла.Вот маленький кусочек кода, который у меня есть :

serp = Nokogiri::HTML(open("http://www.google.com/search?num=100&q=stackoverflow"))

1 Ответ

11 голосов
/ 16 мая 2011

наслаждайтесь:)

require 'open-uri'
require 'nokogiri'

page = open "http://www.google.com/search?num=100&q=stackoverflow"
html = Nokogiri::HTML page

html.search("cite").each do |cite|
  puts cite.inner_text
end

также посмотрите руководства по nokogiri

...