Мне нужно очистить несколько страниц контактов для адресов электронной почты в python, используя селен. Все они различаются по своему макету и структуре сайта, поэтому мне пришлось придумать очень динамичный c XPATH-шаблон для поиска адресов.
Дополнительным препятствием является то, что адреса иногда представляют собой обычный текст, а иногда href mailto:
Шаблон, который у меня до сих пор вроде работает:
email = driver.find_elements_by_xpath("//*[text()[contains(.,'@')]]").text
Но это действительно не работает, если несколько данных хранятся в одном div
Он также возвращает список элементов, но мне нужно только электронное письмо. Если я использую find_element_by_xpath
, текста нет вообще.
Примером может быть попытка очистить этот сайт: http://schandorf.at/service/kontakt/
Итак, если у вас есть какие-нибудь советы, дайте мне знать!