Получение определенного значения атрибута с использованием XPath - PullRequest
9 голосов
/ 11 февраля 2010

Из следующего фрагмента HTML:

<link rel="index" href="/index.php" />
<link rel="contents" href="/getdata.php" />
<link rel="copyright" href="/blabla.php" />
<link rel="shortcut icon" href="/img/all/favicon.ico" />

Я пытаюсь получить значение href тега link со значением rel = "shortcut icon", я пытаюсь добиться этого с помощью XPath.

Как это сделать в Python?

1 Ответ

16 голосов
/ 11 февраля 2010

Как это:

data = """<link rel="index" href="/index.php" />
<link rel="contents" href="/getdata.php" />
<link rel="copyright" href="/blabla.php" />
<link rel="shortcut icon" href="/img/all/favicon.ico" />
"""

from lxml import etree

d = etree.HTML(data)

d.xpath('//link[@rel="shortcut icon"]/@href')
['/img/all/favicon.ico']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...