Читайте href внутри тега привязки, используя Java - PullRequest
0 голосов
/ 14 августа 2010

У меня есть такой фрагмент HTML-кода:

<a href="XXXXXXXXXXXXXXX" target="_blank" class="view_job_link">View or apply to job</a>

Я хочу прочитать значение href XXXXXXXXXX, используя Java.

Обратите внимание: я читаю файл HTML с URL-адреса, используяinputtreamreader (url.openStream ()).

Я получаю полный файл HTML, а фрагмент кода выше является частью этого файла.

Как я могу это сделать?

Спасибо

Карунджай Ананд

Ответы [ 3 ]

3 голосов
/ 14 августа 2010

Используйте html-анализатор, например Jsoup . API прост в освоении, и для вашего случая следующий фрагмент кода сделает

URL url = new URL("http://example.com/");
Document doc = Jsoup.parse(url, 3*1000);
Elements links = doc.select("a[href]"); // a with href
for (Element link : links) {
   System.out.println("Href = "+link.attr("abs:href"));
}
1 голос
/ 14 августа 2010

Используйте анализатор HTML, например TagSoup или что-то подобное.

0 голосов
/ 14 августа 2010

Вы можете использовать собственный HtmlEditorKit Java для анализа html. Таким образом, вам не нужно зависеть от любого стороннего анализатора HTML. Здесь - пример того, как его использовать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...