Как удалить повторяющиеся значения в Google Data Studio - PullRequest
1 голос
/ 06 мая 2020

У меня есть измерение (столбец из таблиц Google) под названием продукты со следующими значениями:

product = [apple , apple_old_2019, pineapple , pineapple_old_2020, pineapple_old_2017 ...]

Мне нужно затем выполнить регулярное выражение и удалить шаблон old_****, а затем агрегировать значения по имени.

В Google Sheets я бы заменил значения, а затем использовал бы уникальную формулу, но в Google Data Studio такой функции нет.

Я создал настраиваемое поле под названием Product_pre по этой формуле:

REGEXP_EXTRACT(Product , '^(.+?)(_old_[0-9]{2}-[0-9]{4})' )

Затем я создал еще одно настраиваемое поле со следующей формулой:

CASE
    WHEN Product_pre_process is null THEN Product
    ELSE Product_pre_process 
END

Проблема в том, что результат имеет повторяющиеся значения:

product_processed = [apple , apple, pineapple , pineapple, pineapple ...]

Как это исправить?

1 Ответ

0 голосов
/ 06 мая 2020

1) Извлечь первое слово
Функция REGEXP_EXTRACT, приведенная ниже, делает трюк (извлекает все символы от начала каждой строки до первого экземпляра _):

REGEXP_EXTRACT(Product , "^([^_]*)")

2) Консолидация
Если тип диаграммы - Таблица , то удалив остальные измерения и оставив только вновь созданное измерение приведет к автоматическому агрегированию значений метри c на основе двух значений в измерении (apple и pineapple).

Отчет Google Data Studio в формате GIF для визуализации приведенного выше:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...