Получение контактного URL с веб-страницы - PullRequest
0 голосов
/ 19 сентября 2019

Я пытаюсь добраться до контактной страницы определенной веб-страницы с красивым супом, но по какой-то причине, которую я не понимаю, мой код не работает ...

Для того, чтобыдля доступа ко всем ветвям дерева HTML я создаю рекурсивную функцию


headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'}


try:
    response = requests.get('http://rafaeldelahoz.com/', headers = headers)

except (requests.exceptions.MissingSchema, requests.exceptions.ConnectionError):
    print('fail')


soup = BeautifulSoup(response.text, 'lxml')

def recursive_find(soup):
    header = soup.find_all()
    for i in header:
        if i.find_all('a', href=re.compile('contact')):
            return i
        else:
            for a in i.find_all_next():
                recursive_find(a)



print(recursive_find(soup)) 

Я ожидаю получить тег контакта для дальнейшего доступа к электронной почте на веб-страницах

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...