Я пытаюсь добраться до контактной страницы определенной веб-страницы с красивым супом, но по какой-то причине, которую я не понимаю, мой код не работает ...
Для того, чтобыдля доступа ко всем ветвям дерева HTML я создаю рекурсивную функцию
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'}
try:
response = requests.get('http://rafaeldelahoz.com/', headers = headers)
except (requests.exceptions.MissingSchema, requests.exceptions.ConnectionError):
print('fail')
soup = BeautifulSoup(response.text, 'lxml')
def recursive_find(soup):
header = soup.find_all()
for i in header:
if i.find_all('a', href=re.compile('contact')):
return i
else:
for a in i.find_all_next():
recursive_find(a)
print(recursive_find(soup))
Я ожидаю получить тег контакта для дальнейшего доступа к электронной почте на веб-страницах