Ниже для BigQuery Standard SQL
Я бы предложил ниже регулярное выражение, чтобы устранить зависимость от жестко закодированного домена
REGEXP_EXTRACT(url, r'(?:https://|http://|)(?:.*?/){2}([^/]*)')
Вы можете протестировать, поиграть с ним, используя приведенный ниже пример
#standardSQL
WITH `project.dataset.table` AS (
SELECT 'https://www.abcd.com/sports/football/gamescore' url UNION ALL
SELECT 'http://www.abcd.com/sports/football/gamescore' url UNION ALL
SELECT 'www.abcd.com/sports/football/gamescore' url UNION ALL
SELECT 'www.abcd.com/sports/football' url UNION ALL
SELECT 'www.abcd.com/sports/' url
)
SELECT REGEXP_EXTRACT(url, r'(?:https://|http://|)(?:.*?/){2}([^/]*)')
FROM `project.dataset.table`
с результатом
Row f0_
1 football
2 football
3 football
4 football
5
Очевидно - вы можете настроить его так, чтобы он представлял ваш реальный вариант использования
Например, изменяя {2}
, вы можете контролировать, какая часть URL для извлечения