Вам не нужно сканировать каждую страницу сведений, чтобы очистить данные name
и URL
. Страницы списка должно быть достаточно.
проверьте обновленную функцию разбора.
def parse(self, response):
self.driver.get(response.url)
item_list = []
list_items = self.driver.find_elements_by_xpath("//*[@id='persona-results']//a[@class='img-wrap']")
for item in list_items:
items = { "url": item.get_attribute("href"),
"name": item.find_element_by_xpath('./div/div[@class="events-details"]/h3').text }
item_list.append(items)
yield items
print(item_list)