Impala - разрешает ли impala multi GROUP_CONCAT в одном запросе - PullRequest
0 голосов
/ 19 октября 2018

Например, у меня есть таблица ниже

+-----------+-------+------------+
|        Id |      a|           b|
+-----------+-------+------------+
|         1 |     6 |         20 |
|         1 |     4 |         55 |
|         1 |     9 |         56 |
|         1 |     2 |         67 |
|         1 |     7 |         80 |
|         1 |     5 |         66 |
|         1 |     3 |         33 |
|         1 |     8 |         34 |
|         1 |     1 |         52 |

Я хочу, чтобы результат был похож на ниже, используя Impala

+-----------+-------------------+-----------------------------+
|        Id |     a             |                           b |
+-----------+-------------------+-----------------------------+
|         1 | 6,4,9,2,7,5,3,8,1 | 20,55,56,67,80,66,33,34,52  |
+-----------+-------------------+-----------------------------+

В Impala я использовал

SELECT Id, 
       group_concat(DISTINCT a) AS a, 
       group_concat(DISTINCT b) AS b 
FROM table GROUP BY Id

Он всегда получит синтаксическую ошибку.Просто интересно, что нам не разрешено использовать multi group_concat для одного запроса в Impala?или не разрешить использовать multi Distinct для одного запроса?

1 Ответ

0 голосов
/ 19 октября 2018

Из документации для GROUP_CONCAT:

Вы не можете применить оператор DISTINCT к аргументу этой функции.

Но,В качестве обходного пути мы можем использовать два отдельных подзапроса для поиска различных значений:

WITH cte1 AS (
    SELECT Id, GROUP_CONCAT(a) AS a
    FROM (SELECT DISTINCT Id, a FROM yourTable) t
    GROUP BY Id
),
cte2 AS (
    SELECT Id, GROUP_CONCAT(b) AS b
    FROM (SELECT DISTINCT Id, b FROM yourTable) t
    GROUP BY Id
)

SELECT
    t1.Id,
    t1.a,
    t2.b
FROM cte1 t1
INNER JOIN cte2 t2
    ON t1.Id = t2.Id;
...