Как группировать по временным интервалам с помощью Google BigQuery - PullRequest
1 голос
/ 16 марта 2019

У меня есть данные о погоде TIMESTAMP каждые 5 минут, которые я хочу сгруппировать с 15-минутными интервалами. Я нашел функцию пола ниже, которая выглядела многообещающей, но BQ не поддерживает функцию UNIX_TIMESTAMP

SELECT
    FLOOR(UNIX_TIMESTAMP(utc_timestamp)/(15 * 60)) AS timekey
GROUP BY
    timekey

Каков наилучший способ сделать это?

1 Ответ

2 голосов
/ 16 марта 2019

Ниже для BigQuery Standard SQL

#standardSQL
SELECT 
  TIMESTAMP_SECONDS(15*60 * DIV(UNIX_SECONDS(utc_timestamp), 15*60)) timekey,
  AVG(metric) metric
FROM `project.dataset.table`
GROUP BY timekey

Вы можете проверить, поиграть с выше, используя фиктивные данные, как в примере ниже

#standardSQL
WITH `project.dataset.table` AS (
  SELECT TIMESTAMP '2019-03-15 00:00:00' utc_timestamp, 1 metric UNION ALL
  SELECT '2019-03-15 00:05:00', 2 UNION ALL
  SELECT '2019-03-15 00:10:00', 3 UNION ALL
  SELECT '2019-03-15 00:15:00', 4 UNION ALL
  SELECT '2019-03-15 00:20:00', 5 UNION ALL
  SELECT '2019-03-15 00:25:00', 6 UNION ALL
  SELECT '2019-03-15 00:30:00', 7 UNION ALL
  SELECT '2019-03-15 00:35:00', 8 UNION ALL
  SELECT '2019-03-15 00:40:00', 9 
)
SELECT 
  TIMESTAMP_SECONDS(15*60 * DIV(UNIX_SECONDS(utc_timestamp), 15*60)) timekey,
  AVG(metric) metric
FROM `project.dataset.table`
GROUP BY timekey
-- ORDER BY timekey  

с результатом

Row timekey                 metric   
1   2019-03-15 00:00:00 UTC 2.0  
2   2019-03-15 00:15:00 UTC 5.0  
3   2019-03-15 00:30:00 UTC 8.0   

Очевидно, что вы можете использовать любую агрегацию, которую требует ваша логика - я использовал AVG () только для примера

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...