Как извлечь текст абзаца в Python, используя lxml из HTML-файла? - PullRequest
0 голосов
/ 31 января 2019

Я пытаюсь извлечь абзац, но получаю [<Element p at 0x7f8c81a26548>] вместо абзаца.Как извлечь абзац?

Selector_1 = "div.bloco-imovel-texto p"
tree.cssselect(Selector_1)
<div class="bloco-imovel-texto">
  <h3 class="lbl_description">
    Description </h3>
  <p>At vero eos et accusamus et iusto odio dignissimos ducimus qui blanditiis praesentium voluptatum deleniti atque corrupti quos dolores et quas molestias excepturi sint occaecati cupiditate non provident, similique sunt in culpa qui officia deserunt mollitia
    animi, id est laborum et dolorum fugaEt harum quidem rerum facilis est et expedita distinctio.Nam libero tempore, cum soluta nobis est eligendi optio cumque nihil impedit quo minus id quod maxime placeat facere possimus, omnis voluptas assumenda est,
    omnis dolor repellendus.</p>
</div>

1 Ответ

0 голосов
/ 31 января 2019

Должно быть

tree.cssselect(Selector_1)[0].text
...