Как получить итоговую сумму из последовательных столбцов в Oracle SQL - PullRequest
3 голосов
/ 18 апреля 2019

У меня проблемы с отображением последовательных выходных из существующего набора данных в Oracle SQL.Например, в декабре 2017 года между 20 и 30 числами будут следующие выходные (потому что Рождество и выходные дни):

  • 23.12.2017 суббота
  • 24.12.2017 воскресенье
  • 25.12.2017 Рождество
  • 30.12.2017 суббота

Теперь я хочу, чтобы мой набор данных результатов выглядел следующим образом (необходим RUNTOT):

DAT         ISOFF   RUNTOT
20.12.2017  0       0
21.12.2017  0       0
22.12.2017  0       0
23.12.2017  1       1
24.12.2017  1       2
25.12.2017  1       3
26.12.2017  0       0
27.12.2017  0       0
28.12.2017  0       0
29.12.2017  0       0
30.12.2017  1       1

Это означает, что при изменении «ISOFF» я хочу посчитать (или суммировать) последовательные строки, где «ISOFF» равен 1.

Я попытался найти решение с аналитической функцией, где я суммирую «ISOFF»."к текущей строке.

  SELECT DAT,
         ISOFF,
         SUM (ISOFF)
         OVER (ORDER BY DAT ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW)
             AS RUNTOT
    FROM (TIME_DATASET)
   WHERE DAT BETWEEN DATE '2017-12-20' AND DATE '2017-12-27'
ORDER BY 1

Теперь я получаю следующий набор данных:

DAT         ISOFF   RUNTOT
20.12.2017  0       0
21.12.2017  0       0
22.12.2017  0       0
23.12.2017  1       1
24.12.2017  1       2
25.12.2017  1       3
26.12.2017  0       3
27.12.2017  0       3
28.12.2017  0       3
29.12.2017  0       3
30.12.2017  1       4

Как я могу сбросить промежуточный итог, если ISOFF изменится на 0?Или это неправильный подход к решению этой проблемы?

Спасибо за помощь!

Ответы [ 3 ]

3 голосов
/ 18 апреля 2019

Это проблема пробелов и островков. Вот один метод, который назначает группы по количеству от 0 до этой строки:

select t.*,
       (case when is_off = 1
             then row_number() over (partition by grp order by dat)
        end) as runtot
from (select t.*,
             sum(case when is_off = 0 then 1 else 0 end) over (order by dat) as grp
      from TIME_DATASET t
     ) t;
2 голосов
/ 18 апреля 2019

Вы можете использовать рекурсивный рекурсивный факторинг подзапросов - предварительное условие состоит в том, что ваши даты являются последовательными без пробелов (или у вас есть последовательность oder номер строки , которой нужно следовать в шагах одного ).

WITH t1(dat, isoff, runtot) AS (
  SELECT dat, isoff, 0 runtot
  FROM   tab 
  WHERE  DAT = DATE'2017-12-20'
  UNION ALL
  SELECT t2.dat, t2.isoff,  
          case when t2.isoff = 0 then 0 else runtot + t2.isoff end as runtot
  FROM   tab t2, t1
  WHERE  t2.dat = t1.dat + 1
)
SELECT  dat, isoff, runtot
FROM   t1;

DAT                      ISOFF     RUNTOT
------------------- ---------- ----------
20.12.2017 00:00:00          0          0
21.12.2017 00:00:00          0          0
22.12.2017 00:00:00          0          0
23.12.2017 00:00:00          1          1
24.12.2017 00:00:00          1          2
25.12.2017 00:00:00          1          3
26.12.2017 00:00:00          0          0
27.12.2017 00:00:00          0          0
28.12.2017 00:00:00          0          0
29.12.2017 00:00:00          0          0
30.12.2017 00:00:00          1          1
1 голос
/ 18 апреля 2019

Другой вариант, который не нуждается в подзапросе или CTE, но требует наличия всех дней для присутствия и того же времени, - только для праздничных дат (где isoff = 1) - чтобы увидеть, сколько дней прошлос момента последней нерабочей даты:

select dat,
  isoff,
  case
    when isoff = 1 then
      coalesce(dat - max(case when isoff = 0 then dat end)
              over (order by dat range between unbounded preceding and 1 preceding), 1)
    else 0
  end as runtot
from time_dataset
order by dat;

DAT             ISOFF     RUNTOT
---------- ---------- ----------
2017-12-20          0          0
2017-12-21          0          0
2017-12-22          0          0
2017-12-23          1          1
2017-12-24          1          2
2017-12-25          1          3
2017-12-26          0          0
2017-12-27          0          0
2017-12-28          0          0
2017-12-29          0          0
2017-12-30          1          1

coalesce() существует в случае, если первая дата в диапазоне является выходным днем ​​- поскольку нет предыдущей нерабочей даты для сравнения с этим вычитаниембудет иметь значение null.

db <> fiddle с набором данных немного большего размера.

...