Я хочу получить исходный код документа HTML, который находится внутри тега HTML, сгенерированного после некоторого JavaScript, и сохранить его в переменной.Здесь HTML-тег <iframe>
содержит переменный тип, похожий на #document
, и когда я его раскрываю, я получаю HTML-документ, который выглядит примерно так: <!DOCTYPE html> <html>...</html>
Подводя итог:
<iframe src="https://www.XXXXXX.com/" allow="autoplay; fullscreen" frameborder="no" scrolling="no" allowfullscreen="yes" style="width: 100%; height: 100%;">
#document
<!DOCTYPE html>
<html>...</html> // a whole new HTML document
</iframe>
Я хочу сохранить все содержимое этого HTML-документа в виде строки в Python
Что я сделал:
driver.find_element_by_xpath('/path/to/iframe/tag').get_attribute('innerHTML')
но это просто возвращает пустую строку.Кроме того, я проверил, работает ли он с BeautifulSoup
html = driver.execute_script("return document.body.innerHTML")
soup = BeautifulSoup(html, 'html5lib')
print(soup.prettify())
, но это также не работает
ПРИМЕЧАНИЕ: Я запускаю этот тест только после сценариятакже, я думаю, проблема, кажется, с #document
вещь