Поиск по сайту - PullRequest
       9

Поиск по сайту

4 голосов
/ 14 февраля 2009

Как вы ищете исходный код веб-сайтов с помощью ruby, трудно объяснить, но вот код для этого в python

import urllib2, re
word = "How to ask"
source = urllib2.urlopen("http://stackoverflow.com").read()
if re.search(word,source):
     print "Found it "+word

Ответы [ 2 ]

3 голосов
/ 14 февраля 2009

Вот один из способов:

require 'open-uri'
word = "How to ask"
open('http://stackoverflow.com') do |f|
  puts "Found it #{word}" if f.read =~ /#{word}/
end
2 голосов
/ 14 февраля 2009

Если все, что вы хотите сделать, это поиск, jcrossley3 дал вам ваш ответ. Если вы хотите сделать что-то более сложное, вы должны взглянуть на HTML-парсер, который может позволить вам рассматривать сайт как дерево DOM. Взгляните на то, почему великолепный hpricot gem делает именно это.

 require 'hpricot'
 require 'open-uri'
 doc = open("http://qwantz.com/") { |f| Hpricot(f) }
 doc.search("//p[@class='posted']")
 (doc/"p/a/img").each do |img|
   puts img.attributes['class']
 end
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...