Я использую селен для удаления некоторых страниц продукта, но в последнее время я получаю только страницу входа в систему (вместо страницы продукта, которую я хотел). Итак, я попытался загрузить страницу в моем браузере и обнаружил, что при доступе к любому URL-адресу продукта откроются две вкладки: одна для входа в систему, а другая для самого продукта. Поэтому мне не нужно входить в систему, мне просто нужно иметь возможность отбрасывать одну из двух страниц, которые открываются каждый раз, когда я пытаюсь получить доступ к URL-адресу.
У меня есть фрейм данных с URL-адресами и разные поля, которые мне нужно очистить, поэтому я передаю URL-адрес как «myurl» этой функции:
item_id=myurl[20:-5]
browser.get(myurl)
html = browser.page_source
soup = BeautifulSoup(html, 'lxml')
try:
titulo = soup.find('div', {'class':'sku-name'}).get_text(strip=True)
except:
titulo=""
, а затем читаю каждое поле из супа, который я использую в chromedriver в python
Любая помощь приветствуется!