При очистке этой страницы:
https://www.hkex.com.hk/Products/Listed-Derivatives/Equity-Index/Hang-Seng-Index-(HSI)/Hang-Seng-Index-Futures?sc_lang=en#&product=HSI
в ключе Google Chrome F12, я вижу, что xpath
t//*[@id="equity_future"]
имеет thead и tbody.Тело доступно.
Однако внутри отладчика python3 с
wdriver = webdriver.PhantomJS() wdriver.get(url) soup = BeautifulSoup(wdriver.page_source,"lxml")
я вижу thead потомков, но tbody выглядит пустым
<tbody> </tbody>
Есть идеи?
Используя только Селен , если вы извлечете page_source, вы можете найти все теги <tbody> следующим образом:
page_source
<tbody>
Кодовый блок:
driver = webdriver.PhantomJS(executable_path=r'C:\WebDrivers\phantomjs.exe') driver.get("https://www.hkex.com.hk/Products/Listed-Derivatives/Equity-Index/Hang-Seng-Index-(HSI)/Hang-Seng-Index-Futures?sc_lang=en#&product=HSI") print(driver.page_source)
Фрагмент вывода консоли 1:
<tbody> <tr> <td class="ls">Last Traded</td> <td class="vo">Volume</td> <td class="oi">Prev.Day Open Interest</td> </tr> </tbody>
Фрагмент вывода консоли 2:
<tbody> <tr> <td class="se">Prev.Day Settlement Price</td> <td class="vo">Volume</td> <td class="oi">Prev.Day Open Interest</td> </tr> </tbody>