Максимальное значение даты возврата для каждой группы в Netezza SQL - PullRequest
0 голосов
/ 24 августа 2018
+--------+---------+----------+------------+------------+
| CASEID | USER ID | TYPE     |   OPEN_DT  |  CLOSED_DT |
+--------+---------+----------+------------+------------+
|      1 |    1000 |  MA      | 2017-01-01 | 2017-01-07 |
|      2 |    1000 |  MB      | 2017-07-15 | 2017-07-22 |
|      3 |    1000 |  MA      | 2018-02-20 | NULL       |
|      8 |    1001 |  MB      | 2017-05-18 | 2018-02-18 |
|      9 |    1001 |  MA      | 2018-03-05 | 2018-04-01 |
|      7 |    1002 |  MA      | 2018-06-01 | 2018-07-01 |
+--------+---------+----------+------------+------------+

Это фрагмент моего набора данных.Мне нужен запрос, который возвращает только строку max (OPEN_DT) для каждого USER_ID в Netezza SQL.

, поэтому, учитывая вышеприведенные результаты, будет:

 | CASEID | USERID |  TYPE | OPEN_DT    |  CLOSED_DT |
 | 3      |  1000  |  MA   | 2018-02-20 | NULL       |
 | 9      |  1001  |  MA   | 2018-03-05 | 2018-04-01 |
 | 7      |  1002  |  MA   | 2018-06-01 | 2018-07-01 |

Любая помощь очень ценится!

1 Ответ

0 голосов
/ 24 августа 2018

Вы можете использовать коррелированный подзапрос:

select t.*
from table t
where open_dt = (select max(t1.open_dt) from table t1 where t1.user_id = t.user_id);

Вы также можете row_number():

select t.*
from (select *, row_number() over (partition by user_id order by open_dt desc) as seq
      from table t
      ) t
where seq = 1;

Однако, если у вас есть связи с open_dt, вам нужно будет использоватьlimit предложение с коррелированным подзапросом, но я не уверен насчет связей, поэтому я просто оставляю это.

...