Итак, я пытаюсь получить доступ к некоторым данным с этой веб-страницы http://www.b3.com.br/pt_br/produtos-e-servicos/negociacao/renda-variavel/empresas-listadas.htm. Я пытаюсь нажать на кнопку с названием «Setor de atuação» с селеном. Проблема в том, что библиотека запросов возвращает мне HTML, отличное от того, которое я вижу, когда проверяю страницу. Я уже пытался отправить заголовок с моим запросом, но это не было решением. Хотя, когда я печатаю содержимое в
browser.page_source
, я все равно получаю неполную часть страницы, которую я хочу. Чтобы попытаться решить проблему, я заметил, что при инициализации сайта отправляются два запроса: print1
Ну, я не уверен, что мне теперь делать. Если кто-нибудь может мне помочь или прислать учебник, объяснить, что происходит, я был бы очень рад. Заранее спасибо. Я сделал только простой веб-скрейпинг, поэтому я не уверен, что делать дальше. Я также проверил другие вопросы на форумах, и ни один из них не похож на мою проблему.
import bs4 as bs
import requests
from selenium import webdriver
options = webdriver.ChromeOptions()
options.add_argument('--ignore-certificate-errors')
options.add_argument('--incognito') #private
#options.add_argument('--headless') # doesnt open page
browser = webdriver.Chrome('/home/itamar/Desktop/chromedriver', chrome_options=options)
site = 'http://www.b3.com.br/pt_br/produtos-e-servicos/negociacao/renda-variavel/empresas-listadas.htm'
browser.get(site)
Это мой код до сих пор. У меня проблемы с поиском и щелчком по кнопке элемента "Setor de Atuação". Я пробовал использовать X_path, class, id, но ничего не работает.