Я новичок в python и Webscraping, я пытаюсь получить список продуктов с веб-сайта- https://www.melaleuca.com/ProductStore/content/category?c=52, но у меня возникает проблема, когда я сталкиваюсь с некоторыми Angular JS. Я могу получить это раньше, используя простой код, например
from bs4 import BeautifulSoup
import requests
laundryUrl = "https://www.melaleuca.com/ProductStore/content/category?c=52"
r = requests.get(laundryUrl)
soup = BeautifulSoup(r.text, features="html.parser")
product = soup.find(class_="category-info-wrapper")
print(product)
. Но когда я сталкиваюсь с ng-include, я больше не могу получить доступ к классам под ними. Когда я использую код
from bs4 import BeautifulSoup
import requests
laundryUrl = "https://www.melaleuca.com/ProductStore/content/category?c=52"
r = requests.get(laundryUrl)
soup = BeautifulSoup(r.text, features="html.parser")
product = soup.find(class_="product-card ng-scope)
print(product)
, я получаю «нет»
Я никогда не использовал angularJS, но из того, что я исследовал, похоже, что в файле html есть еще один файл html, как мне получить к нему доступ и данные? Я пробовал использовать Selenium и столкнулся с той же проблемой.
HTML, когда я просматриваю страницу, выглядит так
<div class="category-info-wrapper"></div>
<ol class="mela-product-wrapper ng-scope" ng-
include="'//cdnus.melaleuca.com/html/product-store/product-card-201905.html'">
<li id="_8219" class="product-card ng-scope" ng-repeat="product in products"
ng-init="culture">
...