как чистить сайты, на которых есть загрузчики? - PullRequest
0 голосов
/ 20 октября 2019

Я пытаюсь почистить сайт, который содержит загрузочные экраны. когда я просматриваю веб-сайт, он показывает загрузку ... на секунду, а затем загружается. Но проблема в том, что когда я пытаюсь очистить его, используя scrapy, это ничего не дает (вероятно, из-за этой загрузки). Могу ли я решить проблему, используя scrapy, или я должен использовать другие инструменты? вот ссылка на сайт, если вы хотите увидеть https://www.graana.com/project/601/lotus-lake-towers

1 Ответ

1 голос
/ 23 октября 2019

Network console Поскольку он отправляет запрос GET для получения информации об объекте, вы должны повторить то же самое в своем коде. (Вы можете наблюдать вызов GET в консоли -> Сеть -> XHR)

    # -*- coding: utf-8 -*-
    import scrapy


    class GranaSpider(scrapy.Spider):
        name = 'grana'
        allowed_domains = 'www.graana.com'
        start_urls = ['https://www.graana.com/api/area/slug/601']

        def parse(self, response):
    #        for url in allurlList:
            scrapy.http.Request(response.url, method='GET' , dont_filter=False)
            print(response.body)
#convert json response to array and save to your storage system

Вывод в формате json, преобразуйте его для вашего удобства.

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...