Веб-парсинг сайта AccuWeather - PullRequest
1 голос
/ 28 мая 2020

Недавно я начал изучать парсинг веб-страниц с помощью Scrapy в python, и у меня возникли проблемы с парсингом данных с сайта AccuWeather.org (https://www.accuweather.com/en/gb/london/ec4a-2/may-weather/328328?year=2020). В основном я фиксирую даты и погодную температуру для целей отчетности. При просмотре сайта я обнаружил слишком много тегов div, поэтому запутался при написании кода. Поэтому я решил обратиться за помощью к специалистам.

Вот мой код для справки.

import scrapy

class QuoteSpider(scrapy.Spider):
    name = 'quotes'
    start_urls = ['https://www.accuweather.com/en/gb/london/ec4a-2/may-weather/328328?year=2020']

    def parse(self, response):
        All_div_tags = response.css('div.content-module')[0]
        #Grid_tag = All_div_tags.css('div.monthly-grid')
        Date_tag = All_div_tags.css('div.date::text').extract()
        yield {
            'Date' : Date_tag}

Я написал это в PyCharm и получаю сообщение об ошибке, так как «код не обрабатывается или не обрабатывается. разрешается". пожалуйста, может ли кто-нибудь помочь мне с этим?

...