Xpath, чтобы получить полный <p>, включая <a> - PullRequest
0 голосов
/ 09 июля 2019

У меня есть следующий HTML-код:

<p class="article-text">Text1 <a href="LINK" target="_blank">LinkText</a> Text2.</p>

Я хочу извлечь полный текст <p> вкл. LinkText, если он есть (не во всех случаях).

Ожидается: " Text1 LinkText Text2. "

Я пытался (//p)[2]

Но он показывает окончание «Text1» только при открытии <a>.

Также попытался (//p)[2]|(//p)[2]/child::node(), но затем он заканчивается на </a>, и я не знаю, как извлечь остальную часть <p>.

Также это может быть не <a> в этом <p> или это может быть 2 <a> в нем.

Ответы [ 2 ]

0 голосов
/ 09 июля 2019

Попробуйте использовать функцию string().

string(//p)

Или более конкретно

string(//p[@class='article-text'])
0 голосов
/ 09 июля 2019

Ваш xpath должен быть.

//p[@class='article-text']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...