Я пытаюсь разработать проект по утилизации веб-страниц, в котором я проверяю веб-сайт Startup India, который вы можете использовать для подключения к стартапам. Здесь я нажал на основе некоторых фильтров, которые я выбрал, и нажал на каждый запуск, и когда я нажимаю на каждый запуск, я должен go внутри этого запуска и удалить его. Но я не могу удалить данные, потому что я не могу захватить ответ для очистки профилей при запуске Индии.
import scrapy
from selenium import webdriver
import os
import logging
class ProductSpider(scrapy.Spider):
name = "product_spider"
allowed_domains = ['https://www.startupindia.gov.in/']
start_urls = ['https://www.startupindia.gov.in/content/sih/en/search.html?industries=sih:industry/advertising&states=sih:location/india/andhra-pradesh&stages=Prototype&roles=Startup&page=0']
def __init__(self):
cwd = os.getcwd()
self.driver = webdriver.Chrome("C:/Users/RAJ/PycharmProjects/WebCrawler/WebCrawler/WebCrawler/spiders/chromedriver.exe")
def parse(self, response):
self.driver.get(response.url)
next = self.driver.find_elements_by_xpath("//*[@id='persona-results']//a[@class='img-wrap']")
logging.info(next)
for i in next:
try:
logging.info(i.click())
logging.info(response.url)
# get the data and write it to scrapy items
except:
print("Yolo")
Код будет оценен