Как извлечь URL из гиперссылок, используя hpricot? - PullRequest
0 голосов
/ 21 июня 2011

Я хотел бы получить фактические строки URL из гиперссылок.Я хотел бы, чтобы мой результат был лишен html.

Итак, если одна из моих входных строк будет

<a href="http://target.com/resource.tar.gz">resource</a>

, я бы хотел получить:

http://target.com/resource.tar.gz

Как я могу это сделать?

1 Ответ

1 голос
/ 21 июня 2011

В Hpricot вы получаете доступ к атрибутам элемента, используя квадратные скобки (как при доступе к элементам в Hash). Итак, чтобы использовать ваш пример:

doc = Hpricot('<a href="http://target.com/resource.tar.gz">resource</a>')

puts doc.at('a')['href']  # => http://target.com/resource.tar.gz
...