Я новичок, пытающийся удалить этот сайт, используя bs4, собирая href из указанного div, а затем перемещаясь по страницам продукта по hrefs и собирая данные, но я застрял в сборе href.Я был бы очень рад, если бы кто-то помог мне в этом:
import urllib.request
from bs4 import BeautifulSoup
urlpage = 'https://www.digikala.com/search/category-tire/'
print(urlpage)
# scrape the webpage using beautifulsoup
# query the website and return the html to the variable 'page'
page = urllib.request.urlopen(urlpage)
# parse the html using beautiful soup and store in variable 'soup'
soup = BeautifulSoup(page, 'html.parser')
# find product items
results = soup.find_all('div', attrs={'class': 'c-product-box__title'})
print('BeautifulSoup - Number of results', len(results))
вот первый результат, хотя, когда вы печатаете результаты, он будет иметь 36 делений, я просто скопировал первый, я старался изо всех сил неспросить и найти ответ, но я даже близко не подошел, так что извините, если это так просто.
<div class="c-product-box__title"><a href="/product/dkp-539563/لاستیک-خودرو-میشلن-مدل-primacy-3-سایز-20555r16-دو-حلقه" target="_blank">لاستیک خودرو میشلن مدل Primacy 3 سایز 205/55R16 - دو حلقه</a></div>