Как получить текст с Xpath, когда текст не в чистой структуре - PullRequest
0 голосов
/ 14 декабря 2018

Я пытаюсь просканировать часть расширенного графика на этой веб-странице: https://bigbangtheory.fandom.com/wiki/The_White_Asparagus_Triangulation

Я пробовал этот Xpath:

//span[contains(@id,'Extended')]/..//following-sibling::P

Но мне не хватает этого абзаца:

Той ночью Шелдон просыпается ...

1 Ответ

0 голосов
/ 15 декабря 2018

Вы должны включить все p теги, а также text узлы после H2 вашего выражения соответствует.Как то так:

<xsl:apply-templates select="//span[contains(@id,'Extended')]/../following-sibling::p|//span[contains(@id,'Extended')]/../following-sibling::text()"/>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...