Как извлечь год из URL-пути, используя REGEXP_EXTRACT в Google Data Studio? - PullRequest
0 голосов
/ 02 апреля 2019

Я создаю панель инструментов Google Data Studio, и мне нужно создать вычисляемое поле для года публикации публикации. Год находится в пути URI, но я не уверен, как извлечь его, используя REGEXP_EXTRACT. Я попробовал ряд предложенных здесь решений, но ни одно из них не работает в Data Studio.

Короче, у меня есть такой URI: /theme/2019/jan/blog-post-2019/

Как использовать функцию REGEXP_EXTRACT для получения первого 2019 года после theme/ и до /jan?

Ответы [ 2 ]

1 голос
/ 02 апреля 2019

Как вы упомянули, я думаю, что вы хотите извлечь только год между строками. Следующий достигнет этого для вас.

соответствует запросу согласно вашим потребностям

 SELECT * 
 FROM Sample_table
 WHERE REGEXP_EXTRACT(url, "(?<=\/theme\/)(?<year>\d{4})(?=\/[a-zA-Z]{3})")
1 голос
/ 02 апреля 2019

Попробуйте это:

REGEXP_EXTRACT(Page, 'theme\/([0-9]{4})\/[a-z]{3}\/') 

где:

  • theme\/ буквально означает «тема /»;
  • ([0-9]{4}) является группа захвата , содержащая 4 символа от 0 до 9 (то есть четыре цифры);
  • \/[a-z]{3}\/ означает косую черту, за которой следуют 3 строчные буквы (если вы хотите, чтобы регулярное выражение совпадало со всеми месяцами),сопровождаемый другим слешем.Если вы хотите что-то более ограничительное, попробуйте с \/(?:jan|feb|mar|...)\/ для последней части.

См. demo .

...