В Python, как извлечь доменную часть URL? - PullRequest
0 голосов
/ 04 апреля 2019

Я использую Python 3.7 и Django.Я хочу извлечь доменную часть URL.Поскольку «домен» может быть неправильным словом, я имею в виду, если URL-адрес

www.yahoo.com

, я хотел бы извлечь «yahoo.com».Если URL-адрес

www.indepednet.co.uk

, я бы хотел извлечь "independent.co.uk".Не уверен, какова правильная терминология для этого.Я пробовал

ext = tldextract.extract(article_stat.article.url)
self.domain = ext.domain.lower()

, но это извлекает только одно слово.В первом примере он извлекает только «Yahoo».Как правильно извлечь домен?

1 Ответ

0 голосов
/ 05 апреля 2019

Вам не хватает суффикса .

Чтобы сделать то, что вы пытаетесь сделать, попробуйте это:

ext = tldextract.extract(article_stat.article.url)
self.domain = ext.domain.lower() + ext.suffix.lower()

Похоже, вы также можете заменитьвторая строка с self.domain = ext.registered_domain

...