SQL агрегирование с использованием группировки по столбцам один за другим - PullRequest
1 голос
/ 21 февраля 2020

Сценарий:

Ниже моя таблица.

+-------+-----------+--------+--------+
|col2   |col3       |col4    |col5    |
+-------+-----------+--------+--------+
|    1.0|          2|       a|      a1|
|    1.0|          1|       a|      a2|
|    1.0|          2|       b|      a3|
|    2.0|          1|       a|      a1|
|    2.0|          1|       a|      a2|
+-------+-----------+--------+--------+

Мне нужно получить агрегированный результат, как показано ниже.

+-------+-----------+-----------+-----------+-----+
|col2   |col3       | field_name|field_value|count|
+-------+-----------+-----------+-----------+-----+
|    2.0|          1|   col3    |          1|    2|
|    1.0|          1|   col3    |          1|    1|
|    1.0|          2|   col3    |          2|    2|
|    2.0|          1|   col4    |          a|    2|
|    1.0|          1|   col4    |          a|    1|
|    1.0|          2|   col4    |          a|    1|
|    1.0|          2|   col4    |          b|    1|
|    1.0|          1|   col5    |         a2|    1|
|    1.0|          2|   col5    |         a1|    1|
|    1.0|          2|   col5    |         a3|    1|
|    2.0|          1|   col5    |         a1|    1|
|    2.0|          1|   col5    |         a2|    1|
+-------+-----------+-----------+-----------+-----+

Реализованное решение:

Я реализовал решение, создав три разные таблицы [T1, T2, T3]. И затем для каждой таблицы я создал [rowset1, rowset2, rowset3] программно, чтобы объединить все в одну таблицу

select col2, col3, col3, count(*) from calc group by col2, col3;
T1 :
|col2   |col3       |col3       |count|
+-------+-----------+-----------+-----+
|    2.0|          1|          1|    2|
|    1.0|          1|          1|    1|
|    1.0|          2|          2|    2|
+-------+-----------+-----------+-----+

rowset1 = [[2.0,1,col3,1,2,18000], [1.0,1,col3,1,1,18000], [1.0,2,col3,2,2,18000]]

select  col2, col3,  col4, count(*) from calc group by col2, col3, col4;
T2:
+-------+-----------+--------+-----+
|col2   |col3       |col4    |count|
+-------+-----------+--------+-----+
|    2.0|          1|       a|    2|
|    1.0|          1|       a|    1|
|    1.0|          2|       a|    1|
|    1.0|          2|       b|    1|
+-------+-----------+--------+-----+
rowset2 = [[2.0,1,col4,a,2,18000], [1.0,1,col4,a,1,18000], [1.0,2,col4,a,1,18000],[1.0,2,col4,b,1,18000]]

select col2, col3, col5 , count(*) from calc group by col2, col3, col5;
T3:
+-------+-----------+--------+-----+
|col2   |col3       |col5    |count|
+-------+-----------+--------+-----+
|    1.0|          1|      a2|    1|
|    1.0|          2|      a1|    1|
|    1.0|          2|      a3|    1|
|    2.0|          1|      a1|    1|
|    2.0|          1|      a2|    1|
+-------+-----------+--------+-----+

rowset3 = [1.0,2,col5,b,1,18000], [1.0,1,col5,a2,1,18000], [1.0,2,col5,a1,1,18000], [1.0,2,col5,a3,1,18000], [2.0,1,col5,a1,1,18000], [2.0,1,col5,a2,1,18000]]


Задача :

Как мне достичь то же самое в SQL без затрат на создание набора строк1,2,3 и объединение его в одну таблицу?

1 Ответ

3 голосов
/ 21 февраля 2020

Если я правильно понимаю, вы хотите сделать три агрегации в одном. Один из методов заключается в использовании cross join для ввода информации для различения guish каждой агрегации:

select col2, col3, field_name,
       (case when field_name = 'col3' then col3
             when field_name = 'col4' then col4
             when field_name = 'col5' then col5
        end) as field_value,
       count(*) as cnt
from t cross join
     (select 'col3' as field_name union all
      select 'col4' as field_name union all
      select 'col5' as field_name
     ) f
group by col2, col3, field_name, field_value
order by field_name, col2 desc, col3;

Здесь - это дб <> скрипка.

...