SQL Server находит дату между различными строками, сумма - PullRequest
1 голос
/ 26 октября 2011

Я пытаюсь создать запрос, который анализирует данные в нашей системе отслеживания времени.Каждый раз, когда пользователь выполняет вход или выход, он создает строку с записью времени проведения и включения или выключения сайта (вход или выход).В случае пользователя 'Joe Bloggs' есть 4 строки, которые я хочу объединить и рассчитать общее время, проведенное на сайте для Джо Блоггса.

Проблема в том, что есть записи, которые не так просто спарить.В приведенном примере у второго пользователя есть два последовательных включения, и мне нужно найти способ игнорировать повторяющиеся строки включения или выключения.

ID  | Time                    |OnOffSite| UserName   
------------------------------------------------------
123 | 2011-10-25 09:00:00.000 | on      | Bloggs Joe |
124 | 2011-10-25 12:00:00.000 | off     | Bloggs Joe |
125 | 2011-10-25 13:00:00.000 | on      | Bloggs Joe |
126 | 2011-10-25 17:00:00.000 | off     | Bloggs Joe |
127 | 2011-10-25 09:00:00.000 | on      | Jonesy Ian |
128 | 2011-10-25 10:00:00.000 | on      | Jonesy Ian |
129 | 2011-10-25 11:00:00.000 | off     | Jonesy Ian |
130 | 2011-10-25 12:00:00.000 | on      | Jonesy Ian |
131 | 2011-10-25 15:00:00.000 | off     | Jonesy Ian |

Моя система - MS SQL 2005. Отчетным периодом для запроса является Ежемесячно.

Может кто-нибудь предложить решение?мои данные уже сгруппированы в таблице по имени пользователя и времени, а поле идентификатора - Identity.

Ответы [ 2 ]

3 голосов
/ 26 октября 2011
-- =====================
-- sample data
-- =====================
declare @t table
(
    ID int,
    Time datetime,
    OnOffSite varchar(3),
    UserName varchar(50)
)

insert into @t values(123, '2011-10-25 09:00:00.000', 'on', 'Bloggs Joe')
insert into @t values(124, '2011-10-25 12:00:00.000', 'off', 'Bloggs Joe')
insert into @t values(125, '2011-10-25 13:00:00.000', 'on', 'Bloggs Joe')
insert into @t values(126, '2011-10-25 17:00:00.000', 'off', 'Bloggs Joe')
insert into @t values(127, '2011-10-25 09:00:00.000', 'on', 'Jonesy Ian')
insert into @t values(128, '2011-10-25 10:00:00.000', 'on', 'Jonesy Ian')
insert into @t values(129, '2011-10-25 11:00:00.000', 'off', 'Jonesy Ian')
insert into @t values(130, '2011-10-25 12:00:00.000', 'on', 'Jonesy Ian')
insert into @t values(131, '2011-10-25 15:00:00.000', 'off', 'Jonesy Ian')

-- =====================
-- solution
-- =====================
select
    UserName, timeon, timeoff, diffinhours = DATEDIFF(hh, timeon, timeoff)
from
(
    select
        UserName,
        timeon = max(case when k = 2 and OnOffSite = 'on' then Time end),
        timeoff = max(case when k = 1 and OnOffSite = 'off' then Time end)
    from
    (
        select
            ID,
            UserName,
            OnOffSite,
            Time,
            rn = ROW_NUMBER() over(partition by username order by id)
        from
        (
            select
                ID,
                UserName,
                OnOffSite,
                Time,
                rn2 = case OnOffSite 
                -- '(..order by id)' takes earliest 'on' in the sequence of 'on's
                -- to take the latest use '(...order by id desc)'
                when 'on' then 
                    ROW_NUMBER() over(partition by UserName, OnOffSite, rn1 order by id)
                -- '(... order by id desc)' takes the latest 'off' in the sequence of 'off's
                -- to take the earliest use '(...order by id)'
                when 'off' then
                    ROW_NUMBER() over(partition by UserName, OnOffSite, rn1 order by id desc)
                end,
                rn1
            from
            (
                select
                    *,
                    rn1 = ROW_NUMBER() over(partition by username order by id) +
                        ROW_NUMBER() over(partition by username, onoffsite order by id desc)
                from @t
            ) t
        ) t
        where rn2 = 1
    ) t1
    cross join
    (
        select k = 1 union select k = 2
    ) t2
    group by UserName, rn + k
) t
where timeon is not null or timeoff is not null
order by username
0 голосов
/ 26 октября 2011

Сначала вам нужно поговорить с бизнес-стороной и принять решение о наборе соответствующих правил.

После этого я предлагаю добавить поле статуса в таблицу, где вы записываете статус каждой строки (соответствует).непревзойденный, удаленный и т. д.).Каждый раз, когда добавляется строка, вы должны попытаться сопоставить ее, чтобы создать пару.Успешное сопоставление устанавливает состояние обеих строк как совпадающее, в противном случае новая строка не будет сопоставлена.

...