String Aggregtion для создания сводных столбцов в Big Query - PullRequest
0 голосов
/ 30 апреля 2020

Я пытаюсь реализовать это точное решение, связанное ниже, но кажется, что GROUP_CONCAT_UNQUOTED больше не является допустимой функцией BQ. Есть ли решение для этого, которое работает в 2020 году?

ps Я бы только прокомментировал исходное сообщение, но, видимо, моя репутация еще недостаточно высока ...

Транспонировать строки в столбцы в BigQuery (реализация Pivot)

1 Ответ

1 голос
/ 30 апреля 2020

Ниже приведен пример для BigQuery Standard SQL

Предположим, у вас есть данные, как показано ниже

#standardSQL
WITH `project.dataset.table` AS (
  SELECT 1 id, 'channel_title' key, 'Mahendra Guru' value UNION ALL
  SELECT 1, 'youtube_id', 'ugEGMG4-MdA' UNION ALL
  SELECT 1, 'channel_id', 'UCiDKcjKocimAO1tV' UNION ALL
  SELECT 1, 'examId', '72975611-4a5e-11e5' UNION ALL
  SELECT 1, 'postId', '1189e340-b08f' UNION ALL

  SELECT 2, 'channel_title', 'Ab Live' UNION ALL
  SELECT 2, 'youtube_id', '3TNbtTwLY0U' UNION ALL
  SELECT 2, 'channel_id', 'UCODeKM_D6JLf8jJt' UNION ALL
  SELECT 2, 'examId', '72975611-4a5e-11e5' UNION ALL
  SELECT 2, 'postId', '0c3e6590-afeb' 
)   

, чтобы повернуть эти ключи - вы можете использовать запрос ниже

#standardSQL
SELECT id, 
  MAX(IF(key = "channel_id", value, NULL)) AS `channel_id`,
  MAX(IF(key = "channel_title", value, NULL)) AS `channel_title`,
  MAX(IF(key = "examId", value, NULL)) AS `examId`,
  MAX(IF(key = "postId", value, NULL)) AS `postId`,
  MAX(IF(key = "youtube_id", value, NULL)) AS `youtube_id` 
FROM `project.dataset.table` 
GROUP BY id 

с результатом

Row id  channel_id          channel_title   examId              postId          youtube_id   
1   1   UCiDKcjKocimAO1tV   Mahendra Guru   72975611-4a5e-11e5  1189e340-b08f   ugEGMG4-MdA  
2   2   UCODeKM_D6JLf8jJt   Ab Live         72975611-4a5e-11e5  0c3e6590-afeb   3TNbtTwLY0U     

, чтобы сделать вашу жизнь проще и не набирать все эти строки для каждого ключа - вместо этого вы можете сгенерировать весь текст SQL, используя запрос ниже

#standardSQL
SELECT 'SELECT id, ' || 
   STRING_AGG(
      'MAX(IF(key = "' || key || '", value, NULL)) as `' || key || '`'
   ) 
   || ' FROM `project.dataset.table` GROUP BY id ORDER BY id'
FROM (
  SELECT key 
  FROM `project.dataset.table`
  GROUP BY key
  ORDER BY key
)        

Примечание: пост, который вы упомянули в своем вопросе, был дан в 2016 году и для Legacy SQL

...