Какой самый эффективный способ выбрать все узлы, где текст в этом узле отличается от его дочерних узлов.
Итак, допустим, есть тег h1 с диапазоном внутри. Я вообще не хочу захватывать тег H1, если он выглядит так:
<h1><span>hello</span></h1>
Я бы только хотел поймать промежуток.
Если это было
<h1><span>Hello</span> World</h1>
Мне нужно захватить их отдельно. Таким образом, текст H1 будет только World, а текст span будет Hello.
До сих пор я пытался
//*[normalize-space()]
, но он получает все элементы, которые не являются желаемым результатом.
Возможно ли сделать каждый элемент сиротой, чтобы html просто стал документом 0- root, где каждый узел находится в своем собственном узле и не имеет родителя?