Question

У меня есть следующий HTML-код:

<p class="article-text">Text1 <a href="LINK" target="_blank">LinkText</a> Text2.</p>

Я хочу извлечь полный текст <p> вкл. LinkText, если он есть (не во всех случаях).

Ожидается: " Text1 LinkText Text2. "

Я пытался (//p)[2]

Но он показывает окончание «Text1» только при открытии <a>.

Также попытался (//p)[2]|(//p)[2]/child::node(), но затем он заканчивается на </a>, и я не знаю, как извлечь остальную часть <p>.

Также это может быть не <a> в этом <p> или это может быть 2 <a> в нем.

zx485 · Answer 1 · 09 июля 2019

Попробуйте использовать функцию string().

string(//p)

Или более конкретно

string(//p[@class='article-text'])

Xpath, чтобы получить полный <p>, включая <a>

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.