Вы можете использовать метод response.urljoin
, чтобы присоединить ваш относительный URL к базовому URL:
def parse_table(self, response):
for links in self._parse_xpath(response, 'table'):
for link in links:
yield Request(url=response.urljoin(link),
callback=self.parse_document_tab)
Или совершенно новый метод response.follow
(Scrapy 1.4.0+), который создает правильный абсолютный URL-адрес и возвращает объект Request
:
def parse_table(self, response):
for links in self._parse_xpath(response, 'table'):
for link in links:
yield response.follow(link, callback=self.parse_document_tab)