Может кто-нибудь предложить способ очистки данных в теге <script>
, в частности, в этом случае 30-минутная таблица из AEMO (https://www.aemo.com.au/aemo/apps/visualisations/elec-nem-priceanddemand.html).
Чтобы получить таблицу данных, мне понадобитсящелкнуть либо по кнопке, чтобы отобразить таблицу на веб-сайте, либо по кнопке загрузки. Однако препятствием здесь является то, что кнопка и текст для таблицы скрыты за тегом <script>
, когда я пытался очистить его с помощью Selenium.
Вот мой код:
# import libraries
import urllib.request
from bs4 import BeautifulSoup
from selenium import webdriver
import time
import pandas as pd
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
url = "https://www.aemo.com.au/aemo/apps/visualisations/elec-nem-priceanddemand.html"
browser = webdriver.Safari(executable_path='/usr/bin/safaridriver')
browser.get(url)
try:
print(browser.page_source)
except:
print("not found")
finally:
browser.quit()
и часть результата:
<body aurelia-app="visualisation-main" data-gr-c-s-loaded="true">
<div class="splash">
<div class="message"><span class="icon-spinner"></span></div>
</div>
<script src="jspm_packages/system.js"></script>
<script src="config.js"></script>
<script>
System.import('aurelia-bootstrapper');
</script>
</body></html>