Как извлечь элемент sr c на веб-страницу в python - PullRequest
0 голосов
/ 12 июля 2020

Мне нужно извлечь изображение sr c вместе с названием бренда из «https://www.gizbot.com/mobile-brands-in-india/». Я пробовал сделать это с помощью scrapy- spider.py

    def parse(self, response):
        page = response.url.split("/")[-2]
        filename = 'mobiles-%s.html' % page
        mob = response.xpath('.//div[has-class("all-brands-block-desc-brand")]/text()').getall()
       
        for mobile in mob:
            m = str(mobile).split()[0]
            with open(filename, 'a') as f:
                f.write("%s %s\n" % (mobile, response.xpath('.//a[contains(@href, m)]').xpath("@href").extract()))
            self.log('Saved file %s' % filename)

, но он не извлекает нужные данные. Я не знаю, где я ошибаюсь. Любая помощь приветствуется.

1 Ответ

1 голос
/ 12 июля 2020

вам необходимо использовать следующий xpath:

mob = response.xpath('//div[contains(@class, "all-brands-block-desc-brand")]').getall()
...