Я разрабатываю скребок для Python с использованием красивого soup4, и у меня возникают трудности с обработкой информации в свертываемом разделе на этой странице: https://www.redfin.com/CA/Los-Angeles/1366-W-22nd-St-90007/home/6896268.
Разборный раздел, который я хочу очистить, - «История собственности для 1366 West 22nd St». Я пытаюсь получить информацию о столбце «дата» и «цена».
url = "https://www.redfin.com/CA/Los-Angeles/1366-W-22nd-St-90007/home/6896268"
headers = { 'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1; Win64; x64)'}
req = urllib.request.Request(url, headers = headers)
res = urllib.request.urlopen(req, context=ssl.SSLContext())
soup = BeautifulSoup(res, 'html.parser')
dates = [td.text for td in soup.find_all('td', {"class": "date-col nowrap"})]
Однако даты, которые я извлек из столбца дат, имеют только 29 октября 2018 года, 24 августа 2018 года и 24 августа 2018 года, поскольку soup.find_all('td', {"class": "date-col nowrap"})
не может найти даты отдыха после этих трех дат. Даты отдыха свернуты и нужно нажать кнопку «Просмотреть всю историю собственности», чтобы развернуть даты отдыха. Есть ли способ очистить свернутые даты с помощью Selenium?