Я бы хотел получить данные (например, рыночную капитализацию, коэффициент PE и т. Д.) Из Google Finance, используя BeautifulSoup-библиотеку Python.Однако, когда я пытаюсь извлечь некоторые отрывки (например, «div», «tr», «td») из html-кода соответствующего сайта Google Finance, используя функцию «find_all», я всегда получаю пустой список (т.е., «базовый» объект в приведенном ниже коде пуст).
Во время отладки я распечатал объект «суп» и сравнил его содержимое с соответствующим html-кодом.Что меня удивило, так это то, что содержимое объекта «суп» отличается от содержимого html-кода.Я ожидаю, что оба должны совпадать, чтобы извлечь данные успешно.
from bs4 import BeautifulSoup
import urllib.request
opener = urllib.request.build_opener()
opener.addheaders = [('User-Agent', 'Mozilla/5.0')]
response = opener.open('https://www.google.com/search?q=NASDAQ:GOOGL')
soup = BeautifulSoup(response, 'html.parser')
base = soup.find_all('div',{'class':'ZSM8k'})
print(soup)
print(base)