Ниже приведено мое регулярное выражение для извлечения URL
url_extractor re.compile(r'((?:www\.|http:|https:)[^\s]+)', re.IGNORECASE)
mystring = """https://myname.abc.comsomename: """
Вышеуказанное регулярное выражение извлекает URL и любые символы, присутствующие после .com
, в данном случае somename
: https://myname.abc.comsomename
.
Я хочу извлечь только до .com
или .org
(включительно), если присутствует. Если URL-адрес не заканчивается на .com
или .org
, я бы хотел извлечь его до пробела.
Так что в приведенном выше примере ожидаемый результат https://myname.abc.com
.
, если URL-адрес https://myname.abc.xyz somename
, ожидаемый результат - https://myname.abc.xyx
.
Как мне изменить вышеприведенное регулярное выражение?