Как я могу найти количество ссылок на веб-странице, указывающих на то же доменное имя, что и на веб-странице, использующей python, beautifulsoup? - PullRequest
0 голосов
/ 07 мая 2018

Я пытался получить все ссылки, используя BeautifulSoup и сравнивая с доменным именем, например example.com. Может ли кто-нибудь помочь в этом отношении?

1 Ответ

0 голосов
/ 09 мая 2018

Я нашел решение, вот код Python для него:

import urllib.request as Ureq
import requests
from bs4 import BeautifulSoup as bs
from urllib.parse import urlparse
def task(url):
    x=Ureq.urlopen(url)
    print ("Total Size of the Web Page = ",len(x.read())," Bytes")
    url_p=urlparse(url)
    domain='{uri.scheme}://{uri.netloc}/'.format(uri=url_p)
    print (domain)
    resp=requests.get(url)
    soup=bs(resp.text,'html.parser')
    r=0
    for link in soup.find_all('a'):
        temp=link.get('href')
        if temp is not None and domain in temp:
        print (temp)
        r=r+1
    print ("Total links pointing to same domain = ",r)
URl_User="abc"
URL_User=input('Enter URl : ')
task(URL_User)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...