Я пытаюсь извлечь цитаты из https://www.goodreads.com/quotes. Кажется, я получаю только первую страницу, а следующая часть страницы не работает. Вот мой код:
import scrapy
class QuotesSpider(scrapy.Spider):
name = 'quotes'
start_urls = [
'http://www.goodreads.com/quotes'
]
def parse(self,response):
for quote in response.xpath("//div[@class='quote']"):
yield {
'quoteText': quote.xpath(".//div[@class ='quoteText']").extract_first()
}
next_page=response.css("a").xpath("@href").extract()
if next_page is not None:
next_page_link=response.urljoin(next_page)
yield scrapy.Request(url=next_page_link, callback= self.parse)