Я пытаюсь разобрать довольно плоский HTML и сгруппировать все от одного тега h1 до следующего. Например, у меня есть следующий HTML:
<h1> Heading 1 </h1>
<p> Paragraph 1.1 </p>
<p> Paragraph 1.2 </p>
<p> Paragraph 1.3 </p>
<h1> Heading 2 </h1>
<p> Paragraph 2.1 </p>
<p> Paragraph 2.2 </p>
<h1> Heading 3 </h1>
<p> Paragraph 3.1 </p>
<p> Paragraph 3.2 </p>
<p> Paragraph 3.3 </p>
Я хочу, чтобы это выглядело так:
<div id='1'>
<h1> Heading 1 </h1>
<p> Paragraph 1.1 </p>
<p> Paragraph 1.2 </p>
<p> Paragraph 1.3 </p>
</div>
<div id='2'>
<h1> Heading 2 </h1>
<p> Paragraph 2.1 </p>
<p> Paragraph 2.2 </p>
</div>
<div id='3'>
<h1> Heading 3 </h1>
<p> Paragraph 3.1 </p>
<p> Paragraph 3.2 </p>
<p> Paragraph 3.3 </p>
</div>
Вероятно, даже не стоит публиковать код, который я сделал до сих пор, поскольку он просто превратился в беспорядок. В основном я пытался сделать запрос Xpath для '// h1'. Создайте новые теги DIV в качестве родительских узлов. Затем скопируйте узел DOM h1 в первый DIV, а затем переберите nextSibling, пока я не нажму еще один тег h1 - как уже упоминалось, он запутался.
Может ли кто-нибудь указать мне лучшее направление?