SQL условная группировка и суммирование - PullRequest
4 голосов
/ 06 декабря 2011

Мои данные выглядят так:

|cat |subcat |amount|
---------------------
|A   |1      |123   |
|A   |2      |456   |
|B   |1      |222   |
|B   |2      |333   |

В первом случае мне нужно суммировать по cat и subcat.Легко:

SELECT cat, subcat, sum(amount) FROM data GROUP BY cat, subcat

Далее, у меня есть более сложное требование, согласно которому для определенных кошек сумма должна быть "задвинута" в данный подкадр.Это может быть сохранено в другой таблице config:

|cat |subcat|
-------------
|B   |1     |

Это говорит мне, что для всех cat='B' строк сумма должна рассматриваться как subcat=1.Кроме того, где cat='B' AND subcat <> 1 сумма должна быть указана как ноль.Другими словами, мне нужен следующий результат:

|cat |subcat|amount|
|A   |1     |123   |
|A   |2     |456   |
|B   |1     |555   |
|B   |2     |0     |

Я не могу обновить свою таблицу данных.Конечно, я могу SELECT ... INTO в процедуре и исправить там данные, но мне интересно, можно ли это сделать одним ударом.

Я могу довольно близко подобраться:

SELECT data.cat,
    ISNULL(config.subcat, data.subcat),
    SUM(amount)
FROM data
    LEFT OUTER JOIN config ON (data.cat = config.cat)
GROUP BY data.cat, ISNULL(config.subcat, data.subcat)

... но мое второе требование не показывает cat:B, subcat:2 как ноль.

Возможно ли это?

Я использую Sybase IQ 12.5 (т.е. старый T-SQL, ноимеет оператор case, который, я подозреваю, может быть полезен)

Ответы [ 6 ]

1 голос
/ 06 декабря 2011

Вам понадобится объединение Data -> Config -> Data, чтобы преобразовать B2 в B1, затем UNION, что в SELECT с оператором Case, а затем SUM и GROUP BY легко

SELECT
   t.CAT, 
   t.SUBCAT, 
   SUM(t.AMOUNT) AMOUNT
FROM
(
SELECT d.cat, 
       d.subcat, 
       CASE 
         WHEN c.subcat IS NULL 
               OR c.subcat = d.subcat THEN d.amount 
         ELSE 0 
       END AS amount 
FROM   data d 
       LEFT JOIN config c 
         ON d.cat = c.cat 

UNION ALL 

SELECT d.cat, 
       d.subcat, 
       d2.amount 
FROM   data d 
       INNER JOIN config c 
         ON ( d.cat = c.cat ) 
       INNER JOIN data d2 
         ON c.cat = d2.cat 
            AND c.subcat <> d2.subcat 
            AND c.subcat = d.subcat 
) t
GROUP BY
    cat,
    subcat
ORDER BY
    cat,
    subcat
​

Рабочий пример можно посмотреть по этому запросу data.se .

Примечание. Я добавил третье значение "B", чтобы проверить, когда существует более одного свернутого SubCat

Другой подход, использующий предложения WITH и ROLLUP (которые поддерживаются в некоторых версиях Sybase, я не знаю, какие)

with g as ( 
    SELECT 

        d.cat, 
        d.subcat,
        c.subcat config_subcat, 
        sum(amount) amount,
        GROUPING(c.subcat) subcatgroup
    FROM   data d 
    LEFT JOIN config c
    ON d.cat = c.cat 

   GROUP BY
      d.cat, 
      d.subcat,
      c.subcat with rollup
)

SELECT
   g.cat, 
   g.subcat,
   case when g.config_subcat is null then g.amount 
     WHEN g.subcat = g.config_subcat THEN g2.amount 
     ELSE 0 end amount
FROM g 

     LEFT JOIN g g2
     ON g.cat = g2.cat and g2.subcatgroup= 1
     and g.subcat is not null and g2.subcat is null

WHERE g.subcatgroup= 0​​

Что можно посмотреть по этому запросу data.se

1 голос
/ 06 декабря 2011

Вот что я придумал.

SELECT cat, subcat, sum(amount)
FROM
(
    SELECT d.cat,
        d.subcat,
        CASE WHEN c.subcat <> d.subcat THEN 0 ELSE amount END amount
    FROM data d
        LEFT OUTER JOIN config c ON (d.cat = c.cat)
    UNION    
    SELECT d.cat,
        ISNULL(c.subcat, d.subcat),
        amount
    FROM data d
        LEFT OUTER JOIN config c ON (d.cat = c.cat)
    WHERE c.subcat <> d.subcat
) AS data2
GROUP BY cat, subcat

Учитывая, что он использует производную таблицу с объединением, и что мой фактический набор данных намного больше, чем тот, который я дал в вопросе, я думаю, что SELECT ... INTO с последующим обновлением может на самом деле быть более производительным подходом!

0 голосов
/ 06 декабря 2011

Это немного похоже на ваше решение, но UNION используется только для создания списка категорий и подкатегорий.Затем этот список объединяется с другой производной таблицей, которая по сути совпадает с правой частью вашего UNION.Здесь идет:

SELECT s.cat, s.subcat, ISNULL(SUM(d.amount), 0)
FROM (
  SELECT cat, subcat FROM data
  UNION
  SELECT cat, subcat FROM config
) s
  LEFT JOIN (
    SELECT
      d.cat,
      subcat = ISNULL(c.subcat, d.subcat),
      d.amount
    FROM data d
      LEFT JOIN config c ON d.cat = c.cat
  ) d ON s.cat = d.cat AND s.subcat = d.subcat
GROUP BY s.cat, s.subcat
0 голосов
/ 06 декабря 2011

Вычислите SUM(amount) для всех "котов", указанных в "config" в производной таблице, затем сопоставьте это с вашими записями в таблице "data", как необходимо:

   SELECT data.cat,
          data.subcat,
          CASE 
            WHEN dt.subcat IS NULL       -- no "config" entry for cat
              THEN data.amount
            WHEN dt.subcat = data.subcat -- "config" for cat and subcat
              THEN dt.total
            ELSE 0                       -- "config" for cat not subcat
          END AS amount
     FROM data
LEFT JOIN (  SELECT config.cat,
                    config.subcat,
                    SUM(data.amount) AS total
               FROM config
               JOIN data USING (cat)
           GROUP BY 1, 2 ) dt
           USING (cat);

+-----+--------+--------+
| cat | subcat | amount |
+-----+--------+--------+
| A   |      1 |    123 |
| A   |      2 |    456 |
| B   |      1 |    555 |
| B   |      2 |      0 |
+-----+--------+--------+
4 rows in set (0.00 sec)
0 голосов
/ 06 декабря 2011

Я использую TSQL, и вот мой код. Это некрасиво, но работает. На самом деле, мне нравится ваш довольно близкий подход (если вы не настаиваете на показе B2 = 0).

SELECT A.cat,
       A.subcat,
       CASE WHEN B.IsConfig = 0 THEN A.amount
            WHEN B.IsConfig = 1 AND C.cat IS NULL THEN 0
            ELSE B.amount 
       END AS amount
FROM data A
INNER JOIN 
(
    SELECT B1.cat, B1.amount, CASE WHEN C1.cat IS NULL THEN 0 ELSE 1 END AS IsConfig
    FROM
    (
        SELECT cat, SUM(amount) amount
        FROM data
        GROUP BY cat
    ) B1 LEFT OUTER JOIN config C1 ON B1.cat = C1.cat
) B ON A.cat = B.cat
LEFT OUTER JOIN config C ON A.cat = C.cat AND A.subcat = C.subcat

--- Я не могу комментировать других, поэтому добавляю свой вопрос сюда ---

По сравнению с другим кодом, использующим план выполнения, стоимость моего запроса составляет 46%. Значит ли это, что это более эффективно? Или это просто зависит:)

0 голосов
/ 06 декабря 2011

Меня немного смущают требования, но я думаю, что это то, что вы хотите.

SELECT d.cat,
       d.subcat, 
       SUM(CASE 
           WHEN c.subcat IS NULL OR c.subcat = d.subcat 
           THEN d.amount 
           ELSE 0 
        END) as Amount
FROM @Data d
    LEFT OUTER JOIN @Config c ON (d.cat = c.cat)
GROUP BY d.cat, d.subcat
ORDER BY d.cat

Пример здесь - http://data.stackexchange.com/stackoverflow/q/120507/

Дай мне знать, если это не то, ради чего ты собирался.

...