Я хочу получить данные с веб-сайта, но чтобы получить данные, мне нужно получить доступ к ссылке с домашней страницы, затем получить данные, после чего мне нужно вернуться на домашнюю страницу и затем повторить цикл, где я получаю доступ к ссылкеполучить данные и затем вернуться.
Я знаю, как получить доступ к ссылке и получить данные, но я хотел бы знать, как я могу получить доступ к другим ссылкам и вернуться туда, где я был после доступапервая ссылка.
Вот то, что я сейчас кодирую:
# -*- coding: utf-8 -*-
import scrapy
class SsFamilleSpider(scrapy.Spider):
name = 'ss_famille'
allowed_domains = ['rexel.fr']
start_urls = ['https://www.rexel.fr/frx/browse/category']
def parse(self, response):
ssfamille = response.xpath("//div[@class='MML2 subDropDownMenu default browse-products-menu categoryList-container']//li//a/@href").get()
yield {'ssfamille': ssfamille}
test = response.xpath("//div[@id='facet_category']//div[@class='allFacetValues']//li//label[@class=' facet_leftCheckBox-label']//span/text()").extract()
yield {'test': test}
next_page = response.xpath("//div[@class='MML2 subDropDownMenu default browse-products-menu categoryList-container']//li//a/@href").get()
if next_page is not None:
yield response.follow(next_page, callback = self.parse)