Groovy htmlunit getByXPath - PullRequest
       13

Groovy htmlunit getByXPath

1 голос
/ 25 ноября 2010

Я сейчас использую HtmlUnit, чтобы попытаться извлечь href со страницы, и у меня возникли некоторые проблемы.

XPath:

/html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a    

На веб-странице это выглядит так:

<a class="t" title="This Brush" href=http://domain.com/this/that">Brush Set</a>

В моем коде я делаю:

hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']")

Тем не менее, это возвращает все, а не только URL, который я хочу.

Может кто-нибудь объяснить, что я должен добавить, чтобы получить href? (также не заканчивается на .html)

1 Ответ

5 голосов
/ 25 ноября 2010

Вы выбираете a.Вы хотите выбрать a/@href.

hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']/@href")
...