ПРИМЕР 1:
<body>
<div>
<h1>category1</h1><a>sibling1</a><a>sibling2</a><h1>category2</h1><a>sibling3</a><a>sibling4</a>
</div>
</body>
так что у них нет общего предка, кроме того, что они находятся под одним div. Как вы сможете создать (что можно выразить с помощью xpath) следующий результирующий строковый формат данных?
category1,sibling1,sibling2;
category2,sibling3,sibling4;
если ПРИМЕР 1 был примерно таким:
<body>
<div>
<span>
<h1>category1</h1><a>sibling1</a><a>sibling2</a>
</span>
<span>
<h1>category2</h1><a>sibling3</a><a>sibling4</a>
</span>
</div>
</body>
здесь, в этом случае, это довольно просто, все, что требуется, - это захватить все теги <SPAN>
с помощью выражения //span
xpath и просмотреть каждый тег <span>
для его <h1>
& <a>
внутри него.