Как маркировать домен и поддомен с помощью python? - PullRequest
0 голосов
/ 28 марта 2019

Я работаю с URL-данными, и у меня есть проблема с категоризацией URL-адреса на домен и поддомен с использованием Python

Я пытаюсь регулярное выражение для извлечения домена, но я не знаю, как вернуть его вTrue или False поддомен

, например,

a = ['facebook.com', 'profile.facebook.com']

Я ожидаю, что результат будет

[False, True]

1 Ответ

0 голосов
/ 28 марта 2019

Вам нужно решить, насколько свободные ограничения вы хотите наложить на доменное имя, остальные могут выглядеть так:

>>> import re
>>> a = re.compile('[0-9a-z\.]*\.[0-9a-z]*\.com')
>>> bool(a.match('facebook.com'))
False
>>> bool(a.match('sub.facebook.com'))
True

Здесь я предположил, что домен будет и с .com, но вы можете изменить это слишком легко.

...