Как извлечь Span Tag с красивым супом - PullRequest
0 голосов
/ 05 января 2020

У меня есть следующий код, где мне нужно извлечь текст между тегами span (в данном случае 05.01.2020), как мне это сделать с красивым супом?

<a class="list listenansicht0" href="wg-zimmer-in-Frankfurt-am-Main-Bornheim.7754140.html" nowrap="">
<span>05.01.2020</span>
</a>

Ответы [ 2 ]

1 голос
/ 05 января 2020

Ниже код извлечет нужный текст.

from bs4 import BeautifulSoup

test_data = """<a class="list listenansicht0" href="wg-zimmer-in-Frankfurt-am-ain-ornheim.7754140.html" nowrap="">
    <span>05.01.2020</span>
    </a>"""

data = BeautifulSoup(test_data, "lxml")

print(data.a.span.text)
1 голос
/ 05 января 2020
from bs4 import BeautifulSoup

data = """
<a class="list listenansicht0" href="wg-zimmer-in-Frankfurt-am-Main-Bornheim.7754140.html" nowrap="">
<span>05.01.2020</span>
</a>
"""
soup = BeautifulSoup(data, 'html.parser')

for item in soup.findAll("a", {'class': 'list listenansicht0'}):
    print(item.text)

Выход:

05.01.2020
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...