Как получить текст после тега - PullRequest
3 голосов
/ 15 сентября 2011

Как получить текст после того, как тег найден

Пример:

#!/usr/bin/env python
import lxml.html

html = """
<b>Point1:</b> Text1 <br>
<b>Point2:</b> Text2 <br>
...
<b>PointN:</b> TextN
<b>PointN+1:</b> TextN+1<br>
"""
dom = lxml.html.document_fromstring(html)
el = dom.xpath('//b[text()="PointN:"]')
print el

тег el с текстом PointN узнал, как получить текст TextN?

Ответы [ 2 ]

3 голосов
/ 15 сентября 2011

Другой способ:

el = dom.xpath('//b[text()="PointN:"]')[0]
print el.tail
3 голосов
/ 15 сентября 2011

Поскольку TextN следует за <b>, который вы уже нашли, вы можете использовать ось XPath following:

dom.xpath('//b[text() = "PointN:"]/following::node()')[0]
...