Как найти тег <div>с определенным значением атрибута, используя Xerces-J? - PullRequest
0 голосов
/ 21 февраля 2012

Я использую Xerces в Java. Я хотел бы проанализировать HTML-документ, чтобы найти элемент div, имеющий определенный атрибут (например, id = myID). Найдя указанный элемент, я бы хотел вернуть текстовое содержимое в div. Мне не удалось найти примеры этого онлайн для Xerces.

Пример:

<div id="myId">foo</div>

Это должно вернуть foo.

1 Ответ

1 голос
/ 23 февраля 2012

Извините, это не отвечает при использовании Xerces-J, но есть библиотека под названием jsoup , предназначенная для такого рода вещей (хотя я уверен, что Xerces может сделать это также). Это что-то вроде Javascript для Java. Jsoup позволяет сделать что-то вроде этого:

String html = "<div id=\"myId\">foo</div>";
Document doc = Jsoup.parse(html);
String divfoo = doc.getElementById("myId").text();
System.out.println(divfoo);

Что ты думаешь?

...