У меня есть структура сайта, которая выглядит примерно так:
<div class='main_container'>
<div class='item_container'>
<div class='body'>
<span class='item_name'>Item 1</span>
<span class='item_desc'>Desc 1</span>
</div>
</div>
<div class='item_container'>
<div class='body'>
<span class='item_name'>Item 2</span>
<span class='item_desc'>Desc 2</span>
</div>
</div>
...
</div><!--End of main_container-->
//Note: Some divs might not have <span @class='item_name'>Item N</span> or other elements inside the item_container
В HtmlUnit 1.14, если я хочу получить все имя элемента:
List<HtmlDivision> divs = (List<HtmlDivision>)page.getByXPath("//div[@class='item_container']");
for(HtmlDivision div:divs){
String name = ((HtmlElement)div.getFirstByXPath("//span[@class='item_name']")).asText();
System.out.println(name);
}
Вывод:
Item 1
Item 2
...
Но в HtmlUnit 2.8, когда я делаю то же самое, я получаю.
Item 1
Item 1
...
Есть ли обходной путь для этого в HtmlUnit 2.8?