Не удается получить HTML-элементы, связанные с определенным тегом с помощью lxml - PullRequest
0 голосов
/ 07 декабря 2018

Я создал выражение xpath для достижения тега a из некоторых элементов HTML.Дело в том, что я не могу напечатать это в консоли.

Я хочу получить относящиеся к html-элементам, связанные с тегом a с помощью библиотеки lxml.

Это моя попытка:

from lxml.html import fromstring

htmlcontent = """
<div class="post-taglist">
    <div class="grid">
        <a href="/questions/tagged/python"></a> 
    </div>
</div>
"""
root = fromstring(htmlcontent)
item = root.xpath("//*[@class='grid']/a")[0]
print(item)

Вывод Iхочу получить:

<a href="/questions/tagged/python"></a>

Как я могу это сделать?Я гуглил, используя много поисковых терминов, но не смог найти прямого ответа на этот вопрос.

1 Ответ

0 голосов
/ 07 декабря 2018

Попробуйте следующее, основываясь на документах :

from lxml.html import fromstring, tostring

htmlcontent = """
<div class="post-taglist">
    <div class="grid">
        <a href="/questions/tagged/python"></a> 
    </div>
</div>
"""

root = fromstring(htmlcontent)
item = root.xpath("//*[@class='grid']/a")[0]

print(tostring(item).strip())

, что приведет к:

<a href="/questions/tagged/python"></a>
...