Если ваши URL-адреса соответствуют указанному выше формату и вам нужен текст от .com
до /mlb
, вы можете использовать следующее регулярное выражение:
.com([\/\d]+)\/mlb
В действии:
>>> s = 'https://espn.com/1234/44/222/mlb/standings'
>>> re.findall(r'.com([\/\d]+)\/mlb', s)
['/1234/44/222']
Вы также можете использовать join
с split
:
>>> '/'.join(s.split('/')[3:6])
1234/44/222