Это на самом деле не вопрос Rails.Это то, что вы делаете с помощью Ruby, а затем, возможно, отображаете с помощью Rails, или Sinatra или Padrino - выбирайте яд.
Существует несколько различных HTTP-клиентов, которые вы можете использовать:
приходит Open-URIс рубином и проще всего.Net :: HTTP поставляется с Ruby и является стандартным набором инструментов, но он более низкого уровня, поэтому вам придется выполнять больше работы.HTTPClient и Typhoeus + Hydra способны работать с потоками и имеют как высокоуровневые, так и низкоуровневые интерфейсы.
Я рекомендую использовать Nokogiri для анализа возвращаемого HTML.Он очень полнофункциональный и надежный.
require 'nokogiri'
require 'open-uri'
doc = Nokogiri::HTML(open('http://www.example.com'))
puts doc.to_html
Если вам нужно перемещаться по экранам входа в систему или заполнять формы, прежде чем вы перейдете на страницу, которую нужно проанализировать, тогда я бы порекомендовал взглянуть на Mechanize.Он основан на Nokogiri, поэтому вы можете запросить документ Nokogiri и проанализировать его, как только Mechanize найдет нужный URL.
Если вам нужно разобраться с Dynamic HTML, посмотрите на различные инструменты WATIR.Они управляют различными веб-браузерами, а затем позволяют вам получать доступ к контенту, видимому браузером.
Когда у вас есть контент или данные, которые вы хотите, вы можете «переназначить» их в текст на странице Rails.