Я новичок в программировании на Python. Я занимаюсь веб-чисткой с использованием модуля bs4 в Python.
Я извлек некоторые поля с веб-страницы, но она извлекает только 13 элементов, тогда как на веб-странице содержится более 13 элементов. Я не могу понять, почему остальные предметы не извлечены.
Другое дело, что я хочу извлечь контактный номер и адрес электронной почты каждого элемента на веб-странице, но они доступны в соответствующих ссылках элемента. Я новичок, и, честно говоря, я застрял в том, как получить доступ и просмотреть ссылку на отдельную веб-страницу каждого элемента в рамках данной веб-страницы. Пожалуйста, расскажите, где я делаю что-то не так и, если возможно, предложите, что нужно сделать.
import requests
from bs4 import BeautifulSoup as bs
import pandas as pd
res = requests.post('https://www.nelsonalexander.com.au/real-estate-agents/?office=&agent=A')
soup = bs(res.content, 'lxml')
data = soup.find_all("div",{"class":"agent-card large large-3 medium-4 small-12 columns text-center end"})
records = []
for item in data:
name = item.find('h2').text.strip()
position = item.find('h3').text.strip()
records.append({'Names': name, 'Position': position})
df = pd.DataFrame(records,columns=['Names','Position'])
df=df.drop_duplicates()
df.to_excel(r'C:\Users\laptop\Desktop\NelsonAlexander.xls', sheet_name='MyData2', index = False, header=True)
Я сделал приведенный выше код только для извлечения имен и позиции каждого элемента, но он только очищает 13 записей, но на веб-странице больше записей, чем это. Я не смог написать какой-либо код для извлечения контактного номера и адреса электронной почты каждой записи, потому что он присутствует на отдельной странице каждого элемента, так как я застрял.
Лист Excel выглядит так: