Мне нужно отсканировать несколько URL-адресов и перенести их содержимое в БД.
сканируемые данные должны содержать как HTML, так и внешние файлы CSS и JS.
Я использовал Nokogiri, чтобы без проблем получить CSS, но я не могу получить Javacript так же просто ...
вот мой соответствующий код:
...
arrJS = []
page = Nokogiri::HTML(open(url))
page.css('script').map {|link| arrJS << link['src'].to_s}
...
когда я использую это на таком сайте, как yahoo.com - я получаю странный массив arrJS, который не имеет отношения к javascripts в html.
есть мысли?