У меня проблема с попыткой получить красивый суп, найти href с определенным названием и извлечь только href.
У меня есть код ниже, но, кажется, не могу заставить его получить только href(независимо от того, что находится между открытием и закрытием) на основе текста гиперссылки, найденного в этом разделе.
res = requests.get(website_url)
soup = bs4.BeautifulSoup(res.text, 'html.parser')
temp_tag_href = soup.select_one("a[href*=some text]")
sometexthrefonly = temp_tag_href.attrs['href']
По сути, я хотел бы, чтобы он прошел через весь html, проанализированный в супе, и возвратил только то, что находится между href open "и close", потому что текст этой гиперссылки - это "некоторый текст".
так что шаги будут:
1: parse html,
2: look at all the a hrefs tags,
3: find the href that has the hyperlink text 'some text',
4: output only what is in between the href " " (not including the
"") for that href
Любая помощь будет принята с благодарностью!