Я пытаюсь очистить веб-сайт, на котором есть ссылка «Показать больше» внизу страницы, которая приводит к большему количеству данных для очистки. Вот ссылка на страницу сайта: https://untappd.com/v/total-wine-more/47792. Вот мой полный код:
class Untap(scrapy.Spider):
name = "Untappd"
allowed_domains = ["untappd.com"]
start_urls = [
'https://untappd.com/v/total-wine-more/47792' #URL: Major liquor store chain with Towson location.
]
def parse(self, response):
for beer_details in response.css('div.beer-details'):
yield {
'name': beer_details.css('h5 a::text').getall(), #Name of Beer
'type': beer_details.css('h5 em::text').getall(), #Style of Beer
'ABVIBUs': beer_details.css('h6 span::text').getall(), #ABV and IBU of Beer
'Brewery': beer_details.css('h6 span a::text').getall() #Brewery that produced Beer
}
load_more = response.css('a.yellow button more show-more-section track-click::attr(href)').get()
if load_more is not None:
load_more = response.urljoin(load_more)
yield scrapy.Request(load_more, callback=self.parse)
Я пытался использовать нижний блок «load_more», чтобы продолжить загружать больше данных для очистки, но никакие входные данные с HTML с веб-сайта не работали.
Вот HTML с веб-сайта.
<a href="javascript:void(0);" class="yellow button more show-more-section track-click" data-track="venue" data-href=":moremenu" data-section-id="140216931" data-venue-id="47792" data-menu-id="38988361">Show More Beers</a>
Я хочу, чтобы паук почистил то, что показано на сайте, затем нажмите ссылку и продолжите чистку страницы. Любая помощь будет принята с благодарностью.