Я написал скрипт на python
, чтобы вычистить описание в Plot
с веб-страницы. Дело в том, что описание находится в нескольких p
тегах. Есть и другие теги p
, которые я не хочу очищать. Как только мой скрипт завершит разбор описания Plot
, он должен остановиться. Однако мой скрипт ниже анализирует все теги p
до конца, начиная с раздела Plot
.
Как я могу ограничить свой скрипт для анализа описания только Plot
?
Это то, что я написал:
import requests
from bs4 import BeautifulSoup
url = "https://en.wikipedia.org/wiki/Alien_(film)"
with requests.Session() as s:
s.headers={"User-Agent":"Mozilla/5.0"}
res = s.get(url)
soup = BeautifulSoup(res.text,"lxml")
plot = [item.text for item in soup.select_one("#Plot").find_parent().find_next_siblings("p")]
print(plot)