Определение последовательных и независимых дней отбора мощности - PullRequest
0 голосов
/ 12 сентября 2018

Исходя из отзывов, я реструктурирую свой вопрос.

Я работаю с SQL над базой данных Presto.

Моя цель - отчитываться о сотрудниках, которые проходят в течение нескольких дней PTO или Sick.Время с начала 2018. Мой желаемый результат будет иметь отдельные острова времени, занятые сотрудником с датами начала и окончания, в соответствии с:

enter image description here

Основная таблица, которую я использую: d_employee_time_off

enter image description here

Существует только два time_off_type_name: PTO и Sick Leave.

ds - это отметка даты, и я использую последние ds (обычно текущую дату)

У меня есть доступ к таблице дат с именем d_date

enter image description here

Я могу присоединиться к таблицам в d_employee_time_off.time_off_date = d_date.full_date

Я надеюсь, что я структурировал этот вопрос понятным способом.

1 Ответ

0 голосов
/ 13 сентября 2018

Я считаю, что здесь необходимо объединить материал выходного дня с таблицей календаря.

В приведенном ниже примере решения я создаю это «на лету», но думаю, у вас есть собственное решение для этого.Также в моем примере я использовал строку «Monday» и отошел от нее (или вы можете использовать «Friday» и двигаться вперед).Я не заинтересован в решениях, зависящих от языка, но, поскольку я не пользователь Presto, я не смог ничего протестировать на Presto.Поэтому в приведенном ниже примере используется некоторая собственная логика, но с помощью синтаксиса SQL Server, который, я надеюсь, вы можете перевести на Presto:

Запрос:

;WITH
Digits AS (
          SELECT 0 AS digit UNION ALL
          SELECT 1 UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL  
          SELECT 5 UNION ALL SELECT 6 UNION ALL SELECT 7 UNION ALL SELECT 8 UNION ALL 
          SELECT 9
          )
, cal AS (
          SELECT 
                 ca.number
               , dateadd(day,ca.number,'20180101') as cal_date
               , datename(weekday,dateadd(day,ca.number,'20180101')) weekday
          FROM Digits [1s]
          CROSS JOIN Digits [10s]
          CROSS JOIN Digits [100s] /* add more like this as needed */
          cross apply (
              SELECT 
                      [1s].digit 
                    + [10s].digit * 10
                    + [100s].digit * 100  /* add more like this as needed */
                    AS number
              ) ca
          )
, time_off AS (
        select
            *
        from cal
        inner join mytable t on (cal.cal_date = t.time_off_date and cal.weekday <> 'Monday') 
                             or (cal.cal_date between dateadd(day,-2,t.time_off_date) 
                                  and t.time_off_date and datename(weekday,t.time_off_date) = 'Monday')
        )
, starting_points AS (
        SELECT
            employee_id,
            cal_date,
            dense_rank() OVER(partition by employee_id
                ORDER BY
                    time_off_date
            ) AS rownum
        FROM
            time_off A
        WHERE
            NOT EXISTS (
                SELECT
                    *
                FROM
                    time_off B
                WHERE
                    B.employee_id = A.employee_id
                    AND B.cal_date = DATEADD(day, -1, A.cal_date)
            )
    )
, ending_points AS (
        SELECT
            employee_id,
            cal_date,
            dense_rank() OVER(partition by employee_id
                ORDER BY
                    time_off_date
            ) AS rownum
        FROM
            time_off A
        WHERE
            NOT EXISTS (
                SELECT
                    *
                FROM
                    time_off B
                WHERE
                    B.employee_id = A.employee_id
                    AND B.cal_date = DATEADD(day, 1, A.cal_date)
            )
    )
SELECT
    S.employee_id,
    S.cal_date AS start_range,
    E.cal_date AS end_range
FROM
    starting_points S
JOIN
    ending_points E
    ON E.employee_id = S.employee_id
    AND E.rownum = S.rownum
order by employee_id
    , start_range

Результат:

    employee_id start_range end_range
1   200035      02.01.2018  02.01.2018 
2   200035      20.04.2018  27.04.2018 
3   200037      27.01.2018  29.01.2018 
4   200037      31.03.2018  02.04.2018 

см .: http://rextester.com/MISZ50793

CREATE TABLE mytable(
   ID INT NOT NULL
  ,employee_id      INTEGER  NOT NULL
  ,type             VARCHAR(3) NOT NULL
  ,time_off_date         DATE  NOT NULL
  ,time_off_in_days INT NOT NULL
);
INSERT INTO mytable(id,employee_id,type,time_off_date,time_off_in_days) VALUES (1,200035,'PTO','2018-01-02',1);
INSERT INTO mytable(id,employee_id,type,time_off_date,time_off_in_days) VALUES (2,200035,'PTO','2018-04-20',1);
INSERT INTO mytable(id,employee_id,type,time_off_date,time_off_in_days) VALUES (3,200035,'PTO','2018-04-23',1);
INSERT INTO mytable(id,employee_id,type,time_off_date,time_off_in_days) VALUES (4,200035,'PTO','2018-04-24',1);
INSERT INTO mytable(id,employee_id,type,time_off_date,time_off_in_days) VALUES (5,200035,'PTO','2018-04-25',1);
INSERT INTO mytable(id,employee_id,type,time_off_date,time_off_in_days) VALUES (6,200035,'PTO','2018-04-26',1);
INSERT INTO mytable(id,employee_id,type,time_off_date,time_off_in_days) VALUES (7,200035,'PTO','2018-04-27',1);
INSERT INTO mytable(id,employee_id,type,time_off_date,time_off_in_days) VALUES (8,200037,'PTO','2018-01-29',1);
INSERT INTO mytable(id,employee_id,type,time_off_date,time_off_in_days) VALUES (9,200037,'PTO','2018-04-02',1);
...