Использование REGEXP для извлечения указанного c текста между косой чертой из URL - PullRequest
2 голосов
/ 07 мая 2020

Мы начали использовать Google Data Studio для визуализации наших данных, и нам нужен REGEX, чтобы помочь нам извлечь определенный c фрагмент текста из списка URL-адресов из нашей системы.

Пример URL: / town / articletype / 46646-this-is-an-example-article

Что нам нужно из URL-адреса с помощью REGEX:

  • / town / (без косой черты, и в конечном итоге первый буква, если возможно)
  • / articletype / (также без косых черт)
  • / 46646- (без / и - && это идентификатор статьи, который нам также нужен)
  • - this-is-an-example-article (без "-" и первой буквы с заглавной буквы)

Мы попробовали множество выражений REGEX, и нам удалось извлечь / town / из URL-адреса, используя следующую формулу : REGEXP_EXTRACT(Page , '/(.*?)(/)')

Нам не повезло с другими частями URL. Любая помощь была бы потрясающей. Заранее спасибо!

1 Ответ

2 голосов
/ 07 мая 2020

4 Вычисляемые поля ниже делают свое дело:

1) Город

CONCAT(UPPER(REGEXP_EXTRACT(Page , "^/(\\w{1})")), LOWER(REGEXP_EXTRACT(Page , "^/\\w{1}([^/]*)")))

2) тип статьи

REGEXP_EXTRACT(Page , "^/\\w+/([^/]*)")

3) 46646

REGEXP_EXTRACT(Page , "^/\\w+/\\w+/([^-]*)")

4) Это пример артикула

CONCAT(UPPER(REGEXP_EXTRACT(Page , "/\\w+/\\w+/\\d+-(\\w{1}).*$")), LOWER(REGEXP_REPLACE(REGEXP_EXTRACT(Page , "/\\w+/\\w+/\\d+-\\w{1}(.*)$"), "-", " ")))

Отчет Google Data Studio и GIF для уточнения:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...