Я работаю над своим самым первым проектом Python, используя BeautifulSoup для веб-обработки данных из https://www.tva.com/Environment/Lake-Levels/South-Holston. Я понимаю основы работы с веб-браузером и слежу за обучающими материалами YouTube. Однако я столкнулся с проблемами при попытке извлечь данные из указанного выше URL.
from bs4 import BeautifulSoup
import requests
URL = requests.get('https://www.tva.com/Environment/Lake-Levels/South-Holston')
soup = BeautifulSoup(URL,'lxml')
main_body = soup.body.div
print(main_body.prettify())
Я использую приведенный выше код basi c для синтаксического анализа страницы на предмет основной части веб-сайта. Распечатав проанализированный контент и сравнив его с исходным кодом в Google Chrome, я заметил, что некоторые элементы отсутствуют. Данные, которые я пытаюсь проанализировать (генераторы в разделе Generation Releases), находятся в таблице, вложенной в класс HTML <div class="tvawidget"...
. При сравнении проанализированных данных с исходным кодом выясняется, что данные в таблице и сама таблица обмениваются с function display(data)
. Надеюсь, все это не слишком запутанно, дайте мне знать, если мне нужно уточнить.
Исходный код данных, которые я пытаюсь извлечь