У меня есть HTML, и мне нужно получить на нем URL-адреса:
<div class="posts-container col-md-6"
<ul class="emb-embassies-list"
<a class="entry-title" href="commonlink.com"
<ul class="emb-embassies-list"
<a class="entry-title" href="rarelink.com"
<div class="col-md-6"
<ul class="emb-embassies-list"
<a class="entry-title" href="anothercommonlink.com"
<ul class="emb-embassies-list"
<a class="entry-title" href="legendarylink.com"
Когда я подаю заявку:
for i in soup.findAll('div', "posts-container col-md-6"):
for anchor in soup.findAll('a', class_="entry-title", href=True):
print(anchor['href'])
Я получаю:
>commonlink.com
>rarelink.com
>anothercommonlink.com
>legendarylink.com
Я хочу получить только "сообщения-контейнер col-md-6":
>commonlink.com
>rarelink.com