Получить доменное имя из URL в коллекции MongoDB - PullRequest
1 голос
/ 23 апреля 2020

Я пытаюсь получить имя домена из поля URL. В настоящее время он хранится в коллекции как URL: https://google.bing.com/Jumbo-Privacy. Мне просто нужно google.bing.com.

Для URL как www.google.com я просто хочу google.com. Могу ли я сделать это непосредственно при отображении результатов коллекции?

Когда я добавляю 'domain': {'$arrayElemAt': [ { '$split': ["$url", "/"] }, 2 ] },

Это работает и возвращает google.bing.com для https://google.bing.com/Jumbo-Privacy. Но все равно возвращает www для всего остального.

Ответы [ 2 ]

1 голос
/ 23 апреля 2020

Использование urlparse из библиотеки urllib.parse .

from urllib.parse import urlparse
url = urlparse('https://google.bing.com/Jumbo-Privacy')
print (url.netloc)

дает:

google.bing.com
0 голосов
/ 23 апреля 2020

Вам понадобится написать собственный код для его анализа.

Вот пример:


//Assuming you'll always have https:// infront

const Url = 'https://moodli.org/geo'

//Split thé URL into an array using the forward slash
let urlSplit = Url.split('/');

//Get the domain name
let domian = urlSplit[2]


...