Я пытаюсь очистить все данные с сайта quotestoscrape. Но, когда я пытаюсь запустить свой код, он получает только одну случайную цитату. Он должен принимать как минимум все данные с этой страницы, но только один. Кроме того, если я каким-то образом получаю данные со страницы 1, теперь мне нужно получить данные со всех страниц.
- Так, как мне решить эту ошибку (которая должна взять все данные со страницы 1)?
- Как мне взять все данные, которые присутствуют на следующих страницах?
items.py file
import scrapy
class QuotetutorialItem(scrapy.Item):
title = scrapy.Field()
author = scrapy.Field()
tag = scrapy.Field()
quotes_spider.py file
import scrapy
from ..items import QuotetutorialItem
class QuoteScrapy(scrapy.Spider):
name = 'quotes'
start_urls = [
'http://quotes.toscrape.com/'
]
def parse(self, response):
items = QuotetutorialItem()
all_div_quotes = response.css('div.quote')
for quotes in all_div_quotes:
title = quotes.css('span.text::text').extract()
author = quotes.css('.author::text').extract()
tag = quotes.css('.tag::text').extract()
items['title'] = title
items['author'] = author
items['tag'] = tag
yield items
Скажите, пожалуйста, какие изменения я могу сделать?