как извлечь содержимое сильного тега с помощью красивого супа? - PullRequest
0 голосов
/ 28 мая 2020
 <li class="bg-blue">
 <img alt="Active Status" src="assets/images/icon-infected.png"/>
 <strong>83004</strong>
 <span>Active Cases</span>

Мне нужно извлечь значения внутри сильного тега, как мне это сделать?

Ответы [ 2 ]

0 голосов
/ 28 мая 2020

Сначала вы находите элемент strong и используете text для получения значения. Вы можете попробовать:

html_doc = """
<li class="bg-blue">
<img alt="Active Status" src="assets/images/icon-infected.png"/>
<strong>83004</strong>
<span>Active Cases</span>
"""

soup = BeautifulSoup(html_doc, 'lxml')

value = soup.find('strong').text
print(value)
0 голосов
/ 28 мая 2020

С beautifulsoup вы можете использовать contents , чтобы получить это, вот так.

html_doc = """
<li class="bg-blue">
<img alt="Active Status" src="assets/images/icon-infected.png"/>
<strong>83004</strong>
<span>Active Cases</span>
"""

from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc, 'html.parser')

soup.strong.contents
# 83004
...