Я пытаюсь очистить содержимое каждого тега span, следующего за сильным тегом, а также самого сильного тега. В настоящее время у меня есть печать сильных тегов, но я не могу напечатать следующий тег span для каждого сильного тега. Вот мой код:
import bs4 as bs
from urllib.request import urlopen, Request
import urllib
#all strong tags
strong_tags = soup.find_all('strong')
for element in strong_tags:
element.extract()
print(element.text)
и вывод, который я получаю:
severity:
ID:
File Name:
Version:
Family:
Published:
Dependencies:
Risk Factor:
Required KB Items:
Содержимое тегов span должно go после каждого двоеточия, но я не могу его получить к. Вот часть html Я соскоб.
<div class="col-md-4 plugin-single__sidebar">
<h4 class="u-m-t-2">Plugin Details</h4>
<div>
<p>
<strong>Severity
<!-- -->:
</strong>
<span>Critical</span>
</p>
</div>
<div>
<p>
<strong>ID
<!-- -->:
</strong>
<span>14612</span>
</p>
</div>
<div>
<p>
<strong>File Name
<!-- -->:
</strong>
<span>aix_IY40501.nasl</span>
</p>
</div>