Я пытаюсь извлечь элементы абзаца со страницы Википедии под идентификатором = 'See', все в список.
Использование:
import bs4
import requests
response = requests.get("https://wikitravel.org/en/Bhopal")
if response is not None:
html = bs4.BeautifulSoup(response.text, 'html.parser')
plot = []
# find the node with id of "Plot"
mark = html.find(id="See")
# walk through the siblings of the parent (H2) node
# until we reach the next H2 node
for elt in mark.parent.nextSiblingGenerator():
if elt.name == "h2":
break
if hasattr(elt, "text"):
plot.append(elt.text)
Теперь я хочу извлечь только те абзацы, которые содержат жирный элемент внутри них. Как я могу добиться этого здесь?