Вы можете использовать REGEXP_EXTRACT(sentence, r'\w+\s+\w+')
, например,
#standardSQL
WITH `project.dataset.table` AS (
SELECT 'One Two Three Four Five' sentence
)
SELECT sentence, REGEXP_EXTRACT(sentence, r'\w+\s+\w+') AS first_two_words
FROM `project.dataset.table`
выходы
Row sentence first_two_words
1 One Two Three Four Five One Two
Также рассмотрите скорректированную версию, как показано ниже, если вам нужно обрабатывать край, когдав предложении есть только одно слово
#standardSQL
WITH `project.dataset.table` AS (
SELECT 'One Two Three Four Five' sentence UNION ALL
SELECT 'One'
)
SELECT sentence, REGEXP_EXTRACT(sentence, r'\w+(?:\s+\w+)?') AS first_two_words
FROM `project.dataset.table`
с результатом
Row sentence first_two_words
1 One Two Three Four Five One Two
2 One One
Подробнее о REGEXP_EXTRACT можно прочитать здесь
Также обратите внимание: BigQuery обеспечивает поддержку регулярных выражений с использованием библиотеки re2 ;см. эту документацию для ее синтаксиса регулярного выражения.