Временное окно в PostgreSQL - PullRequest
1 голос
/ 19 июня 2020

Я новичок в PostgreSQL (в частности, я использую Timescale db) и у меня есть вопрос относительно времени windows.

Data:

date      |customerid|names   
2014-01-01|1         |Andrew 
2014-01-02|2         |Pete   
2014-01-03|2         |Andrew 
2014-01-04|2         |Steve  
2014-01-05|2         |Stef   
2014-01-06|3         |Stef  
2014-01-07|1         |Jason 
2014-01-08|1         |Jason 

Вопрос: собираюсь назад во времени x дней (просматривается из каждой отдельной строки), сколько существует различных имен с одним и тем же идентификатором?

Для x = 2 дня результат должен выглядеть так:

date      |customerid|names  |count 
2014-01-01|1         |Andrew |1 
2014-01-02|2         |Pete   |1 
2014-01-03|2         |Andrew |2 
2014-01-04|2         |Steve  |3 
2014-01-05|2         |Stef   |3 
2014-01-06|3         |Stef   |1
2014-01-07|1         |Jason  |1
2014-01-08|1         |Jason  |1  

Возможно ли это в PostgreSQL без использования al oop для каждой отдельной строки?

Дополнительная информация: Временные интервалы данных в действительности не равноудалены.

Спасибо очень понравилось!

1 Ответ

3 голосов
/ 19 июня 2020

Было бы неплохо, если бы вы могли использовать оконные функции:

select t.*,
       count(distinct name) over (partition by id
                                  order by date
                                  range between interval 'x day' preceding and current row
                                 ) as cnt_x
from t;

Увы, это невозможно. Таким образом, вы можете использовать боковое соединение:

select t.*, tt.cnt_x
from t left join lateral
     (select count(distinct t2.name) as cnt_x
      from t t2
      where t2.id = t.id and
             t2.date >= t.date - interval 'x day' and t2.date <= t.date
     ) tt
     on true;

Для повышения производительности вам нужен индекс для (id, date, name).

...