Я скачал scrapy-crawl-Once и пытаюсь запустить его в своей программе. Я хочу вычеркнуть URL каждой книги с первой страницы http://books.toscrape.com/, а затем вычеркнуть название книги из этого URL. Я знаю, что могу вычеркнуть название каждой книги с первой страницы, но в качестве практики для scrapy-crawl-Once, я хотел сделать это таким образом. Я уже добавил промежуточное программное обеспечение и должен знать, куда добавить request.meta. Проведя некоторые исследования, не так уж много кодов для примера руководства, поэтому я надеялся, что кто-то может помочь здесь. Я выучил основы python двух недель go, так изо всех сил прямо сейчас. Я пробовал это, но результаты не изменились. Может кто-нибудь помочь мне, пожалуйста. Я добавил [: 2], чтобы, изменив его на [: 3], я мог показать, что он работает.
def parse(self, response):
all_the_books = response.xpath("//article[@class='product_pod']")
for div in all_the_books[:2]:
book_link = 'http://books.toscrape.com/' + div.xpath(".//h3/a/@href").get()
request = scrapy.Request(book_link, self.parse_book)
request.meta['book_link'] = book_link
yield request
def parse_book(self, response):
name = response.xpath("//div[@class='col-sm-6 product_main']/h1/text()").get()
yield {
'name': name,
}