Мой подход - создать элемент, заполнить его данными, которые есть у меня на этой странице, а затем запросить страницу с недостающими данными, передав элемент в пределах meta
. Когда вторая страница загружена, я получаю элемент из meta
и заполняю другими данными:
def parseItem(self, response):
'''Get date from the first page.'''
item = Item()
item['firstdata'] = '???'
...
otherDataPageLink = '???'
yield Request(otherDataPageLink, meta = {'item': item}, callback = self.parseComments)
def parseComments(self, response):
'''Get all the other data from second page.'''
item = response.meta['item']
item['otherdata'] = '???'
yield item # return the item with all the data