В настоящее время я пытаюсь очистить URL-адреса продуктов с платформы электронной коммерции Lazada, однако я получаю случайные ссылки с веб-сайта, а не ссылки на продукты.
https://www.lazada.com.my/oldtown-white-coffee/?langFlag=en&q=All-Products&from=wangpu&pageTypeId=2
Мой код ниже:
from bs4 import BeautifulSoup, SoupStrainer
import requests
url = "https://www.lazada.com.my/oldtown-white-coffee/?langFlag=en&q=All-
Products&from=wangpu&pageTypeId=2"
page = requests.get(url)
data = page.text
soup = BeautifulSoup(data)
links = soup.find_all('div', {'class': 'c16H9d'})
for link in soup.find_all("a"):
print(link.get("href"))
Результат, который я получаю из этого кода (это не то, что я хочу):
Этоэто раздел ссылок, которые мне нужны, я хотел бы перечислить все URL-адреса продуктов со страницы продуктов.
Я надеюсь, что вы, ребята, можетепомогите мне в этом, я знаю, что это просто, это, кажется, не работает, смотрю на это со вчерашнего дня.