Question

Я сейчас использую HtmlUnit, чтобы попытаться извлечь href со страницы, и у меня возникли некоторые проблемы.

XPath:

/html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a

На веб-странице это выглядит так:

<a class="t" title="This Brush" href=http://domain.com/this/that">Brush Set</a>

В моем коде я делаю:

hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']")

Тем не менее, это возвращает все, а не только URL, который я хочу.

Может кто-нибудь объяснить, что я должен добавить, чтобы получить href? (также не заканчивается на .html)

Mads Hansen · Answer 1 · 25 ноября 2010

Вы выбираете a.Вы хотите выбрать a/@href.

hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']/@href")

Groovy htmlunit getByXPath

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.