Я очищаю веб-сайт с битом html в этом формате.
</p></div><div class="content "><ul class="office-list"><li><a href="javascript:void(0)" class="_office atlanta" data-slug="atlanta" data-title="Atlanta" data-address="Twilio Atlanta<br />950 East Paces Ferry Road NE, 18th Floor<br />Atlanta, GA 30326<br />"
Я попытался использовать код python, который:
items = driver.find_elements_by_xpath("//*[contains(@class, 'address')]")
for item in items:
addresses.append(item.text)
Однако в этом случае это не класс, который содержит 'address'
, это data-address
. Как я могу найти любой атрибут элемента, который содержит 'address'
?