htmlparser.Parser,
У меня есть фрагмент HTML (см. Ниже), и мне нужно, чтобы получить содержание
в моем файле куча этих контейнерных элементов с уникальными идентификаторами.
Я могу получить div и их внутренний HTML просто отлично. Я не могу понять
узнать, что между тегами H3
этот фрагмент кода работает для div, но не для h3:
если находит h3 с правильным идентификатором, я просто не могу понять, как
получить innerHTML или что между тегами.
спасибо за любую помощь
parser = new Parser();
parser.setInputHTML(inHTML);
parser.setEncoding("UTF-8");
lstNodes = parser.extractAllNodesThatMatch( new AndFilter(new TagNameFilter("h3"),
new HasAttributeFilter("id", "h3_"+num)));
Это находит, но не возвращает данные между h3
<div class="container" id="container_2">
<h3 id="h3_2">Adding a few</h3>
<div class="maindiv" id="div_2">
...new articles in here jus tto flesh it out.
</div><!--end of div_2-->
</div>