Вот мой код:
from selenium import webdriver
import pandas as pd
from lxml import etree
url = 'https://www.morningstar.com/stocks/xbsp/UGPA3/quote'
browser = webdriver.Chrome()
browser.get(url)
htmlpage = browser.page_source
doc = etree.HTML(htmlpage)
cap = doc.xpath(
'/html/body/div[1]/div/div/div[3]/main/div[2]/div/div/div[1]/sal-components/section/div/div/div[1]/div/div[2]/div/div/div/div[2]/ul/li[7]/div/div[2]/text()')
print(cap)
Я пытаюсь соскрести номер рыночной капитализации с веб-страницы.
Я узнал после записи переменной htmlpage в файл, что проблема является то, что он не загружает всю страницу. Он загружает 2228 КБ, в то время как мой браузер загружает файл размером 2664 КБ. html и папку, в которой нет необходимости. Если я вручную сохраню страницу в своем браузере и использую ее содержимое в качестве входных данных для etree. HTML (), это работает, но я хочу автоматизировать.