Я хочу почистить некоторые новостные ссылки с этого сайта. Для этого мой код таков:
from bs4 import BeautifulSoup
import requests
base = "https://www.philstar.com/business/"
page = requests.get(base)
soup = BeautifulSoup(page.text, "html.parser")
li_box = soup.find_all("href")
links = open("News article links.txt", "w+")
for a in li_box:
links.write(base+a['href']+"\n")
Проблема в том, что он находит только 15-16 ссылок, отображаемых на целевой странице. Если вы вручную прокрутите вниз до нижней части страницы, вы увидите, что она загружает больше новостей. Прокрутите больше, и он будет загружаться больше, и так далее. Код не может выполнить эту часть «прокрутка вниз, чтобы увидеть больше». Как мне почистить все эти новости (или, скажем, первые 1000)?