Я пытаюсь очистить данные с этой веб-страницы, и я успешно могу очистить данные, что мне нужно.
Проблема в том, что загруженная страница с использованием requests
содержит только 45 сведений о продукте. но на самом деле на этой веб-странице имеется более 4000 продуктов, это происходит потому, что все данные не доступны напрямую, они отображаются только в том случае, если вы прокрутите страницу вниз.
Я хотел бы просмотреть все продукты, доступные на странице.
КОД
import requests
from bs4 import BeautifulSoup
import json
import re
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:50.0) Gecko/20100101 Firefox/50.0'}
base_url = "link that i provided"
r = requests.get(base_url,headers=headers)
soup = BeautifulSoup(r.text, 'html.parser')
scripts = soup.find_all('script')[11].text
script = scripts.split('=', 1)[1]
script = script.rstrip()
script = script[:-1]
data = json.loads(script)
skus = list(data['grid']['entities'].keys())
prodpage = []
for sku in skus:
prodpage.append('https://www.ajio.com{}'.format(data['grid']['entities'][sku]['url']))
print(len(prodpage))