Я новичок в изучении веб-страниц. Я хочу, чтобы скребок возвращал все абзацы с ключевым словом «neuro», однако, когда я запускаю код, кажется, что он возвращает одинаковые выходные данные для всех итераций. Не могли бы вы указать мне на мою ошибку?
import requests
from requests import get
from bs4 import BeautifulSoup
import pandas as pd
import numpy as np
import re
from time import sleep
from random import randint
url = "https://www.findamasters.com/masters-degrees/united-kingdom/?40w900"
results = requests.get(url)
info =[]
page_number = np.arange(1,1219)
soup = BeautifulSoup(results.text, "html.parser")
for page in page_number:
page = requests.get("https://www.findamasters.com/masters-degrees/united-kingdom/?40w900&PG=" + str(page))
div = soup.find("p", string =re.compile('neuro'))
sleep(randint(2,10))
masters = pd.DataFrame({
'info': div})
masters.to_csv('masters.csv')
Но единственный вывод, который я получаю:
<p>It’s our mission to prolong and improve the lives of patients, and we seek to do this by conducting world-leading research in areas such as neuroscience, oncology, infectious diseases and more.</p>
<p>It’s our mission to prolong and improve the lives of patients, and we seek to do this by conducting world-leading research in areas such as neuroscience, oncology, infectious diseases and more.</p>
....