Получить только идентификатор и ссылку - PullRequest
0 голосов
/ 03 февраля 2012

Мой вывод состоит из нескольких идентификаторов, href и других данных.

Как получить все значения id и href, используя Htmlunit и код Java?

Мне нужно получить все значения href, но id не обязателен ...

Как я могу это сделать и где мне написать данный код.

<a id="Repeater1_ctl00_HyperLink2" href="/jobs/Physical-Security-Specialist-308550900.html">

<a id="Repeater1_ctl05_HyperLink1" href="/jobs/Safety-and-Occup-Hlth-Specialist-308549000.html">

<a id="Repeater1_ctl08_HyperLink2" href="/jobs/Nurse-Practitioner-Oca-Esep-Dh-308526400.html">

<a id="Repeater1_ctl09_HyperLink1" href="/jobs/Nurse-Practitioner-Oca-Esep-Dh-308526400.html">

и т.д .....

1 Ответ

0 голосов
/ 04 февраля 2012

Я не пишу код для вас :) Но я могу дать вам представление о решении.

Получите HtmlPage. Попробуйте получить весь объект HtmlAnchor страницы (вы можете использовать XPath для этого). Выполните итерацию по коллекции HtmlAnchor и выполните метод getHrefAttribute () , чтобы получить атрибут href. Аналогично используйте метод getId () объекта HtmlAnchor, чтобы получить его идентификатор. Вот и все:)

...