Если я не пропустил что-то, заголовок и резюме выглядят одинаково. Вы можете использовать :has
с bs4 4.7.1+, чтобы у вашего article
был ребенок href
;и это, кажется, лишает article
элементов тега, которые не являются частью основного тела, что, как я подозреваю, на самом деле является вашей целью
from bs4 import BeautifulSoup as bs
import requests
base = 'https://www.vanglaini.org'
r = requests.get(base)
soup = bs(r.content, 'lxml')
for article in soup.select('article:has([href])'):
headline = article.h5.text.strip()
summary = re.sub(r'\n+|\r+',' ',article.p.text.strip())
link = f"{base}{article.a['href']})"
print(headline)
print(summary)
print(link)