В настоящее время я пытаюсь очистить данные продукта с lazada.sg, используя bs4 в приведенном ниже коде.
from bs4 import BeautifulSoup
import requests
url = "https://www.lazada.sg/shop-mobiles/"
page = requests.get(url)
content = page.text #read html
soup = BeautifulSoup(content, 'html.parser')
products = soup.find_all("div", {"class" : "c16H9d"}) #find div tags containing product details
with open("test.txt", 'w') as f:
f.write(str(products))
Однако вывод в test.txt
равен просто []
. Я обнаружил, что приведенный выше класс находится в <div id="root">
, который я извлек и получил этот результат .
Как я смогу получить доступ к «внутренним тегам div»? Здесь - фрагмент исходного кода страницы.