Содержание страницы загружается с использованием JavaScript.Самый простой способ проверить, является ли содержимое динамическим, - это щелкнуть правой кнопкой мыши и просмотреть источник страницы и проверить, присутствует ли содержимое там.Вы также можете отключить JavaScript в своем браузере и перейти по URL.
Вы можете использовать селен , чтобы получить содержимое
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from bs4 import BeautifulSoup
driver = webdriver.Chrome(executable_path='/path/to/chromedriver')
driver.get("https://www.khanacademy.org/profile/DFletcher1990/")
element=WebDriverWait(driver, 20).until(EC.presence_of_element_located((By.XPATH ,'//*[@id="widget-list"]/div[1]/div[1]/div[2]/div/div[2]/table')))
source=driver.page_source
soup=BeautifulSoup(source,'html.parser')
user_info_table=soup.find('table', class_='user-statistics-table')
for tr in user_info_table.find_all('tr'):
tds=tr.find_all('td')
print(tds[0].text,":",tds[1].text)
Вывод:
Date joined : 4 years ago
Energy points earned : 932,915
Videos completed : 372
Другая доступная опция (поскольку вы уже знакомы с запросами) - это использовать reports-html
from bs4 import BeautifulSoup
from requests_html import HTMLSession
session = HTMLSession()
r = session.get('https://www.khanacademy.org/profile/DFletcher1990/')
r.html.render(sleep=10)
soup=BeautifulSoup(r.html.html,'html.parser')
user_info_table=soup.find('table', class_='user-statistics-table')
for tr in user_info_table.find_all('tr'):
tds=tr.find_all('td')
print(tds[0].text,":",tds[1].text)
Output
Date joined : 4 years ago
Energy points earned : 932,915
Videos completed : 372
Пока чтоДругой вариант - узнать, что делается ajax-запрос, эмулировать его и проанализировать ответ.Этот ответ не всегда должен быть JSON.Но в этом случае контент не отправляется в браузер через ответ Ajax.Он уже присутствует в источнике страницы.
Страница просто использует JavaScript для структурирования этой информации.Вы можете попытаться получить данные из этого тега сценария, это может потребовать некоторого регулярного выражения, а затем сделать json из строки.