Как я могу применить функцию к каждому элементу столбца массива? - PullRequest
1 голос
/ 30 сентября 2019

У меня есть набор данных, в котором был столбец с массивом объектов, таких как:

ID   TAGS
1    {"tags": [{"tag": "a"}, {"tag": "b"}]}
2    {"tags": [{"tag": "c"}, {"tag": "d"}]}

Я хочу извлечь поле tag каждого элемента массива, поэтому конечный результат будет:

ID   TAGS
1    ["a","b"]
2    ["c","d"]

Предполагая следующую таблицу t1:

CREATE OR REPLACE TEMPORARY TABLE t1 AS (
      select 1 as ID , PARSE_JSON('{"tags": [{"tag":"a"}, {"tag":"b"}]}') AS PAYLOAD
    UNION ALL
    select 2, PARSE_JSON('{"tags": [{"tag":"c"}, {"tag":"d"}]}')

);

Ответы [ 2 ]

1 голос
/ 30 сентября 2019

Подход, основанный на чистом SQL, заключается в объединении LATERAL FLATTEN и ARRAY_AGG следующим образом:

with t2 as (
    select ID, t2.value:tag as tag
    from t1, LATERAL FLATTEN(input => payload:tags) t2
)
select t2.id, ARRAY_AGG(t2.tag) as tags from t2
group by ID 
order by ID ASC;

t2 само по себе станет:

ID  TAG
1   "a"
1   "b"
2   "c"
2   "d"

и после GROUP BY ID становится:

ID  TAGS
1   [    "a",    "b"  ]
2   [    "c",    "d"  ]
1 голос
/ 30 сентября 2019

Одним из возможных решений является создание функции javascript и использование javascript .map () для применения функции к каждому элементу массива:

create or replace function extract_tags(a array)
  returns array
  language javascript
  strict
  as '

  return A.map(function(d) {return d.tag});
  ';

SELECT ID, EXTRACT_TAGS(PAYLOAD:tags) AS tags from t1;

, что дает желаемоерезультат:

ID  TAGS
1   [    "a",    "b"  ]
2   [    "c",    "d"  ]
...