Я пытаюсь найти «ближайшие» узлы в документе HTML, который содержит во внутреннем тексте определенную строку, используя библиотеки xpath или javascript (node); в HTML-фрагменте вроде
<p>Lorem ipsum dolor sit <strong>amet, <em>{cons</em>ectetur} adipiscing elit.</strong> Morbi rhoncus lacinia orci a dapibus. Nulla facilisi. Sed id nibh ornare, aliquet ante nec, efficitur leo. Sed viverra ex turpis,</p>
если я ищу слова, которые соответствуют {cons.*tur}
, поэтому в этом случае {consectetur}
я хочу найти узел <strong>
, а не узел <p>
, потому что это самый маленький узел, который имеет его.
edit: strong
- это всего лишь пример, это может быть любой tagName, и он может быть глубоко вложенным; слово, которое я ищу, также может быть разбито более чем на два уровня вложенности, как в примере выше.
больше редактировать: я на самом деле ищу шаблон, поэтому //div[contains(., 'consectetur')]
не будет работать.