Вытащить href с красивыми суппортами - PullRequest
0 голосов
/ 24 августа 2018

Я пробую что-то новое, вытаскивая все href в тегах a.Это не вытаскивает hrefs, хотя и не могу понять, почему.

import requests
from bs4 import BeautifulSoup

url = "https://www.brightscope.com/ratings/"
page = requests.get(url)
soup = BeautifulSoup(page.text, 'html.parser')

for href in soup.findAll('a'):
    h = href.attrs['href']
    print(h)

1 Ответ

0 голосов
/ 24 августа 2018

Вы должны проверить, существует ли ключ, так как он может также не существовать href между <a> тегами.

import requests
from bs4 import BeautifulSoup

url = "https://www.brightscope.com/ratings/"
page = requests.get(url)
print(page.text)
soup = BeautifulSoup(page.text, 'html.parser')

for a in soup.findAll('a'):
    if 'href' in a.attrs:
        print(a.attrs['href'])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...