хотите использовать sql подсчитывать людей онлайн с начальным и конечным временем - PullRequest
1 голос
/ 08 марта 2020

Я хочу использовать sql Количество онлайн-пользователей с начальным и конечным временем на presto。

мои данные вроде:

userid  begintime   endtime
023150000030040 2020-03-05 12:50:46 2020-03-05 12:50:49
023150004186637 2020-03-05 10:31:19 2020-03-05 10:31:24
023150000788581 2020-03-05 00:59:01 2020-03-05 01:02:00
023150004411606 2020-03-05 19:55:42 2020-03-05 20:02:51
023150004066308 2020-03-05 18:48:03 2020-03-05 18:58:03
023150002033547 2020-03-05 12:39:24 2020-03-05 12:42:21
023150000030040 2020-03-05 13:26:02 2020-03-05 13:26:04
023150003690798 2020-03-05 02:04:50 2020-03-05 02:14:50
023150000030040 2020-03-05 13:57:10 2020-03-05 13:57:12
023150004460558 2020-03-05 16:44:48 2020-03-05 16:47:58

Я хочу считать людей онлайн каждый час. Теперь у меня есть глупый способ считать. Мой sql вроде:

select '01' as hour,COUNT(distinct T.userid)
from datamart_ott_b2b_jsydcp.f_tplay t where t.topicdate  ='2020-03-05'   
and t.begintime < date_parse('2020-03-05 01', '%Y-%m-%d %h')
and t.endtime > date_parse('2020-03-05 00', '%Y-%m-%d %h')

union all 

select  '02' as hour,COUNT(distinct T.userid)
from datamart_ott_b2b_jsydcp.f_tplay t where t.topicdate  ='2020-03-05'   
and t.begintime < date_parse('2020-03-05 02', '%Y-%m-%d %h')
and t.endtime > date_parse('2020-03-05 01', '%Y-%m-%d %h')

.......

Есть ли более простой способ сделать это? THX

Ответы [ 2 ]

1 голос
/ 08 марта 2020

В Prestodb вы можете сгенерировать массив с целочисленными значениями, а затем развернуть их, чтобы получить часы. Затем используйте join s и group by, чтобы выполнить необходимые вычисления:

select hh.hh as hour, cont(distinct t.userid)
from (select sequence(0, 23) hhs
     ) h cross join
     unnest(h.hhs)  as hh(hh) left join
     datamart_ott_b2b_jsydcp.f_tplay t
     on hour(begintime) <= hh.hh and
        hour(enddtime) >= hh.hh
where t.topicdate  = '2020-03-05'  
group by hh.hh
order by hh.hh;
0 голосов
/ 08 марта 2020

Используя подход календарной таблицы, мы можем оставить таблицу, содержащую все 24 часа, в вашей текущей таблице при условии, что и час, и дата совпадают. Затем мы можем агрегировать по часам и подсчитывать разных пользователей, чтобы получить желаемый результат.

WITH hours AS (
    SELECT 0 AS hour UNION ALL
    SELECT 1 UNION ALL
    SELECT 2 UNION ALL
    ...
    SELECT 23
)

SELECT
    h.hour,
    COUNT(DISTINCT t.userid) AS user_cnt
FROM hours h
LEFT JOIN datamart_ott_b2b_jsydcp.f_tplay t
    ON h.hour = DATE_TRUNC('hour', t.topicdate) AND
       t.topicdate = '2020-03-05'
GROUP BY
    h.hour
ORDER BY
    h.hour;
...