Я пытаюсь очистить исторические и прогнозируемые почасовые цены на энергию по следующему URL: https://hourlypricing.comed.com/pricing-table-today/
Я смог сделать это для другой таблицы, которая является прогнозируемыми на завтра цены https://hourlypricing.comed.com/pricing-table-tomorrow/
... до сих пор работа над выпадающим списком стоит у меня над головой.
Я не совсем понимаю, как это можно сделать с помощью выбора даты. То, что я хотел бы сделать, это получить данные за весь 2018 год.
Когда я использую Selenium IDE, чтобы записать, какие шаги предпринять
вообще не увеличивать год в режиме записи, но работает нормально, когда я изменяю дату без записи? Любые указатели относительно того, как подойти к этой проблеме, будут оценены. Из того, что я понимаю, насколько я могу записывать команды в IDE, а затем писать один и тот же код на python?
from pandas.io.html import read_html
from selenium import webdriver
from operator import itemgetter
#driver = webdriver.Firefox()
from bs4 import BeautifulSoup
options = webdriver.ChromeOptions()
options.add_argument('headless')
driver = webdriver.Chrome(chrome_options=options)
driver.get('https://hourlypricing.comed.com/pricing-table-tomorrow/')
table = driver.find_element_by_class_name('prices')
tablehtml = table.get_attribute('outerHTML')
soup = BeautifulSoup(tablehtml,'xml')
table = soup.find("table", { "class" : "prices" })
#print(table)
table_body = table.find('tbody')
#print(table_body)
data = []
rows = table_body.find_all('tr')
for row in rows:
cols = row.find_all('td')
cols = [ele.text.strip() for ele in cols]
cents = cols[1]
cents = cents[:-1]
cols[1] = cents
data.append([ele for ele in cols if ele])
sortedData = sorted(data, key=itemgetter(1))
pprint(sortedData)
driver.close()