Я хотел бы знать, как я могу получить доступ ко всем текстам на веб-странице, используя http-модуль.У меня проблема в том, что getTextBlocks
, похоже, возвращает текст только в тегах h1
.. h6
.Я хотел бы найти текст «Поддержка LS», который содержится в приведенном ниже фрагменте HTML.Извините за мой короткий вопрос, но поиск по номеру httpunit getTextBlocks
не дает много полезных совпадений.Интересно, должен ли я рекурсивно опускать текстовые блоки, поскольку каждый текстовый блок, похоже, имеет getTextBlocks
- метод.
TextBlock[] texts;
try {
texts = actualResponse.getTextBlocks();
} catch (SAXException e) {
e.printStackTrace();
return e.toString();
}
errorMessage = "Did not find needle " + webService.getWebServiceNeedle();
for(int i = 0; i<texts.length; ++i) {
TextBlock tb = texts[i];
if(debugMode) {
logger.debug("Web Check " + webService.getWebServiceName() + " Text =" + tb.getText());
}
if(tb.getText().indexOf(webService.getWebServiceNeedle()) >= 0) {
logger.info("Found needle" + webService.getWebServiceNeedle());
errorMessage = null;
break;
}
}
<!-- <body> -->
<header class="clsHead">
<div>
<a href="#wrapper" id="menu-toggle" class="glyphicons glyphicons-show-lines clsMenuMain"></a>
</div>
<div>
<span class="clsHeadFont"> 2.0 </span>
</div>
<div>
<marquee id="flashMessage" style="position: absolute;bottom: 18px;left:240px;" class="span8" scrollamount="4"></marquee>
</div>
<div class="CLSuserloginadmin">
<!-- <span ><div style="float:right">
</div></span> -->
<span class="clsHeadFont1">Welcome, Support LS</span> <span
class="clsHeadFont1 clsHeadLogPad"> | </span> <a href="logout">Logout </a>
<a class="dropdown-toggle" data-toggle="dropdown"><img
class=""
src="/rator-monitoring/resources/img/setting.png"
id="lodindb"
style="width: 28px; margin-top: -5px; padding-left: 11px;"></a>
<ul class="dropdown-menu" role="menu">
<li class="version">About</li>
<li class="preferences">User Preferences</li>
</ul>
</div>
</header>