Как выбрать интервал ДАТЫ, которые не имеют пробелов? - PullRequest
0 голосов
/ 01 июля 2019

У меня есть ежедневные даты в каждой строке, с началом и концом, и если они применимы для этого запроса. Мне нужно вернуть все интервалы дней, когда нет разрыва.

Пример таблицы:

+----+---------------------+---------------------+--------+--------------------------------------+
| ID | DATE_START          | DATE_END            | STATUS | COMMENT                              |
|----+---------------------+---------------------+--------+--------------------------------------+
|  1 | 2019-01-01 00:00:00 | 2019-01-02 00:00:00 | 1      |                                      |
|----+---------------------+---------------------+--------+--------------------------------------+
|  2 | 2019-01-02 00:00:00 | 2019-01-03 00:00:00 | 1      |                                      |
|----+---------------------+---------------------+--------+--------------------------------------+|
|    |                     |                     |        | <-- did this gap visually, following |
|    |                     |                     |        | <-- dates are more than 1 day off    |
|----+---------------------+---------------------+--------+--------------------------------------+
| 10 | 2019-02-07 06:00:00 | 2019-02-08 06:00:00 | 1      |                                      |
|----+---------------------+---------------------+--------+--------------------------------------+
| 11 | 2019-02-08 06:00:00 | 2019-02-09 06:00:00 | 1      |                                      |
|----+---------------------+---------------------+--------+--------------------------------------+
| 12 | 2019-02-09 06:00:00 | 2019-02-10 06:00:00 | 1      |                                      |
|----+---------------------+---------------------+--------+--------------------------------------+
| 13 | 2019-02-10 06:00:00 | 2019-02-11 06:00:00 | 0      | <-- gap, as STATUS=0                 |
|----+---------------------+---------------------+--------+--------------------------------------+
| 14 | 2019-02-11 06:00:00 | 2019-02-12 06:00:00 | 1      |                                      |
|----+---------------------+---------------------+--------+--------------------------------------+

Таблица результатов должна выглядеть так:

+---------------------+---------------------+----------+
| INTERVAL_START      | INTERVAL_END        | IDS      |
+---------------------+---------------------+----------+
| 2019-01-01 00:00:00 | 2019-01-03 00:00:00 | 1,2      |
+---------------------+---------------------+----------+
| 2019-02-07 06:00:00 | 2019-02-10 06:00:00 | 10,11,12 |
+---------------------+---------------------+----------+
| 2019-02-11 06:00:00 | 2019-02-12 06:00:00 | 14       |
+---------------------+---------------------+----------+

Хорошо, выбор, если STATUS<>0 в порядке. С чем я борюсь, так это то, что я понятия не имею о том, как мне начинать оживление, если также доступен следующий день, и если так, продолжайте, пока не будет следующего дня (и также не соберите идентификаторы этих дней).

Поскольку этот запрос будет содержать огромное количество других данных, это вовсе не проблема. Я просто не могу обернуть голову вокруг этого рекурсивного материала.

Было бы очень полезно, если бы это был настолько стандартный SQL, насколько это возможно, так как этот запрос может быть перенесен в будущем.

РЕДАКТИРОВАТЬ: О, как вы видите там отметки времени, DATE_START всегда совпадает с часом / минутой, как DATE_END с предыдущего дня (если существует).

Ответы [ 2 ]

1 голос
/ 01 июля 2019

MT0 является правильным, хотя я думаю, что предложение count ... filter проще для чтения, чем sum ... case:

with t as (
  select 1 as id, timestamp '2019-01-01 00:00:00' as date_start, timestamp '2019-01-02 00:00:00' as date_end, 1 as status union
  select 2 as id, timestamp '2019-01-02 00:00:00' as date_start, timestamp '2019-01-03 00:00:00' as date_end, 1 as status union
  select 10 as id, timestamp '2019-01-07 06:00:00' as date_start, timestamp '2019-01-08 06:00:00' as date_end, 1 as status union
  select 11 as id, timestamp '2019-01-08 06:00:00' as date_start, timestamp '2019-01-09 06:00:00' as date_end, 1 as status union
  select 12 as id, timestamp '2019-01-09 06:00:00' as date_start, timestamp '2019-01-10 06:00:00' as date_end, 1 as status union
  select 13 as id, timestamp '2019-01-10 06:00:00' as date_start, timestamp '2019-01-11 06:00:00' as date_end, 0 as status union
  select 14 as id, timestamp '2019-01-11 06:00:00' as date_start, timestamp '2019-01-12 06:00:00' as date_end, 1 as status
), t2 as (
  select t.*, lag(date_end) over (order by date_start) as prev_date_end
  from t
  where status = 1
), t3 as (
  select t2.*, count(1) filter (where date_start is distinct from prev_date_end) over (order by date_start) as g
  from t2
)
select min(date_start), max(date_end), string_agg(cast(id as text),',') from t3
group by g
order by g

Работает в https://www.db -fiddle.com / сВерсия PG 9.6.

1 голос
/ 01 июля 2019

Установка Oracle :

CREATE TABLE test_data ( ID, DATE_START, DATE_END, STATUS ) AS
  SELECT  1, DATE '2019-01-01', DATE '2019-01-02', 1 FROM DUAL UNION ALL
  SELECT  2, DATE '2019-01-02', DATE '2019-01-03', 1 FROM DUAL UNION ALL
  SELECT 10, DATE '2019-01-07' + INTERVAL '6' HOUR, DATE '2019-01-08' + INTERVAL '6' HOUR, 1 FROM DUAL UNION ALL
  SELECT 11, DATE '2019-01-08' + INTERVAL '6' HOUR, DATE '2019-01-09' + INTERVAL '6' HOUR, 1 FROM DUAL UNION ALL
  SELECT 12, DATE '2019-01-09' + INTERVAL '6' HOUR, DATE '2019-01-10' + INTERVAL '6' HOUR, 1 FROM DUAL UNION ALL
  SELECT 13, DATE '2019-01-10' + INTERVAL '6' HOUR, DATE '2019-01-11' + INTERVAL '6' HOUR, 0 FROM DUAL UNION ALL
  SELECT 14, DATE '2019-01-11' + INTERVAL '6' HOUR, DATE '2019-01-12' + INTERVAL '6' HOUR, 1 FROM DUAL

Запрос :

SELECT MIN( date_start ) AS date_start,
       MAX( date_end   ) AS date_end,
       LISTAGG( id, ',' ) WITHIN GROUP ( ORDER BY date_start, date_end ) AS ids
FROM   (
  SELECT id,
         date_start,
         date_end,
         status,
         SUM( change_group ) OVER ( ORDER BY date_start, date_end )
           AS group_id
  FROM   (
    SELECT t.*,
           CASE
           WHEN date_start = LAG( date_end ) OVER ( ORDER BY date_start, date_end )
           AND  1          = LAG( status   ) OVER ( ORDER BY date_start, date_end )
           AND  1          = status
           THEN 0
           ELSE 1
           END AS change_group
    FROM   test_data t
  )
  WHERE  status = 1
)
GROUP BY group_id

Вывод :

DATE_START          | DATE_END            | IDS     
:------------------ | :------------------ | :-------
2019-01-01 00:00:00 | 2019-01-03 00:00:00 | 1,2     
2019-01-07 06:00:00 | 2019-01-10 06:00:00 | 10,11,12
2019-01-11 06:00:00 | 2019-01-12 06:00:00 | 14      

дБ <> скрипка здесь

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...