Сохранить HTML таблицу во внешний HTML файл со страницы, защищенной паролем - PullRequest
0 голосов
/ 21 января 2020

Мне нужно вытащить всю таблицу html со страницы, защищенной паролем, и сохранить ее во внешнем файле html.

<table id="tblControlorStatus" class="dataTable" aria-describedby="" style="">

driver=webdriver.Firefox()
driver.get("http://MYURL")

assert "Page title" in driver.title 

username = driver.find_element_by_id("ctl00_ContentPlaceHolder1_Login1_UserName")
username.clear()
username.send_keys("MYUSER")

password = driver.find_element_by_name("ctl00$ContentPlaceHolder1$Login1$Password")
password.clear()
password.send_keys("MYPASS")

driver.find_element_by_name("ctl00$ContentPlaceHolder1$Login1$LoginButton").click()

driver.find_element_by_link_text("MYLINKTEXT").click()

html=driver.page_source
soup=BeautifulSoup(html,'lxml')
div=soup.select_one("table#tblControlorStatus")
table=pd.read_html(str(div), header = 0)
print(table[0])

Это только печатает значения из стол до терминала

Ответы [ 2 ]

1 голос
/ 21 января 2020

Вместо этого:

table=pd.read_html(str(div), header = 0)
print(table[0])

Попробуйте что-то вроде этого

html_content = str(div)
html_file = open("output.html", "w")
html_file.write(html_content)
html_file.close()

Это должно записать вашу таблицу во внешний файл.

0 голосов
/ 22 января 2020

Спасибо .... это работало с этой маленькой модификацией:

html_file = open('D://output.html', 'w', encoding="utf-8")
html_file.write(html_content)
html_file.close()'
...