используя BeautifulSoup, чтобы найти ссылку href - PullRequest
0 голосов
/ 07 апреля 2019

Я использую BeautifulSoup, чтобы найти ссылку по классу "reply_to".

<div class="message">
   <div class="reply_to details">
        In reply to <a href="#go_to_message18" onclick="return 
        GoToMessage(18)">this message</a>
   </div>
</div>

теперь приведенный ниже код может найти элемент reply_to, но как перейти к и извлечь href из

soup = BeautifulSoup(parsed.input[0], "html.parser")
alldefaultmesssages = soup.select(".message.default")
alldefaultmesssages.select_one(".reply_to")

1 Ответ

1 голос
/ 07 апреля 2019

Вам нужно достать до ребенка anchor тег элемента reply_to:

import requests
from bs4 import BeautifulSoup


html = """<div class="message">
   <div class="reply_to details">
        In reply to <a href="#go_to_message18" onclick="return
        GoToMessage(18)">this message</a>
   </div>
</div>"""

soup = BeautifulSoup(html, 'html.parser')
print(soup.find("div", class_="reply_to").a.get('href'))
#>>> #go_to_message18
...