Проверьте вашу переменную allowed_domains
.Вы должны добавить новый домен, например ['www2.hm.com', 'forever21.com']
или удалить его вообще.Также у вас нет функции parse
.
Я могу предположить, что вы удалили start_urls
с помощью if
и вместо него использовали start_requests
.Ваш код будет более читабельным.
import scrapy
class SalesitemSpiderSpider(scrapy.Spider):
name = 'salesitem_spider'
allowed_domains = ['www2.hm.com', 'forever21.com']
def start_requests(self):
urls = (
(self.parse_1, 'https://www2.hm.com/en_us/sale/shopbyproductladies/view-all.html?sort=stock&image-size=small&image=stillLife&offset=0&page-size=9999'),
(self.parse_2, 'https://www.forever21.com/us/shop/catalog/category/f21/sale'),
)
for cb, url in urls:
yield scrapy.Request(url, callback=cb)
def parse_1(self, response):
print 111111111
def parse_2(self, response):
print 2222222222