У меня есть эта вложенная карта сайта.Документы Scrapy говорят, что он должен работать с вложенными картами сайта без каких-либо проблем.Мои целевые ссылки похожи на эту https://flatinfo.ru/arenda_kvartir.asp?id=867039 Так что в моем понимании мой sitemap_rules
, содержащий ключевое слово из ссылки ('/arenda_kvartir/'
), должен заставить паука вести себя по следующей логике: все ссылки найденыв sitemap.xml
и содержащее ключевое слово из sitemap_rules
следует добавить в функцию parsed
.Но это никогда не происходит в соответствии с журналами.Паук просто проходит все основные категории в карте сайта и выходит.Где я не прав?Ниже мой код.
# -*- coding: utf-8 -*-
import scrapy
from scrapy.spiders import SitemapSpider
class CodeSpider(SitemapSpider):
name = 'code_s'
sitemap_urls = ['https://flatinfo.ru/sitemap.xml']
sitemap_rules = [
('/arenda_kvartir/', 'parsed'),
('/sitemap_prodaja_kvartir/', 'parsed'),
]
def parsed(self, response):
yield {
}