Пожалуйста, используйте правильные теги для своих вопросов и поделитесь своим кодом, чтобы мы знали, сколько вы сделали, а не предоставляли полный ответ.Спасибо,
Попробуйте это:
from bs4 import BeautifulSoup
import requests, re
''' Don't forget to install/setup package = 'lxml' '''
url = "http://www.github.com"
response = requests.get(url)
data = response.text
soup = BeautifulSoup(data,'lxml')
tags = soup.find_all('a')
''' This will print every available link'''
for tag in tags:
print(tag.get('href'))
''' this will print links with only prefix as given'''
for link in soup.find_all('a',attrs={'href': re.compile("^https://github")}):
print(link.get('href')