Question

Пожалуйста, посмотрите на этот код:

# -*- coding: utf-8 -*-
from lxml import etree
html_fragment = "<body><p>This is html, you can <a href='wikpedia'>learn more</a> on the wikipedia page</p></body>"

tree = etree.fromstring(html_fragment, etree.HTMLParser())

for x in tree.findall(".//p") :
    print(x.text)

этот отпечаток:

This is html, you can

он обрезает текст перед тегом a.как я могу получить весь текст тега p?

Dany M · Answer 1 · 02 июня 2018

найти решение: нужно использовать .text_content () вместо .text

официальный документ lxml

LXML обрезает текст в первом вложенном теге

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

LXML обрезает текст в первом вложенном теге

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы