Извлечение последней записи в каждой группе из базы данных - SQL Server 2005/2008 - PullRequest
17 голосов
/ 20 января 2011

Я провел некоторые поиски, но, похоже, не могу получить результаты, которые я ищу. По сути, в нашей компании действуют четыре разные системы управления, и я нахожусь в процессе регулярного объединения всех данных из каждой системы. Моя цель - обновлять данные каждый час в центральной базе данных. Вот пример набора данных, с которым я работаю:

COMPUTERNAME | SERIALNUMBER | USERNAME | LASTIP | LASTUPDATE | SOURCE
TEST1 | 1111 | BOB | 1.1.1.1 | 1/17/2011 01:00:00 | MGMT_SYSTEM_1
TEST1 | 1111 | BOB | 1.1.1.1 | 1/18/2011 01:00:00 | MGMT_SYSTEM_2
TEST1 | 1111 | PETER | 1.1.1.11 | 1/19/2011 01:00:00 | MGMT_SYSTEM_3
TEST2 | 2222 | GEORGE | 1.1.1.2 | 1/17/2011 01:00:00 | MGMT_SYSTEM_1
TEST3 | 3333 | TOM | 1.1.1.3 | 1/19/2011 01:00:00 | MGMT_SYSTEM_2
TEST4 | 4444 | MIKE   | 1.1.1.4 | 1/17/2011 01:00:00 | MGMT_SYSTEM_1
TEST4 | 4444 | MIKE   | 1.1.1.41 | 1/19/2011 01:00:00 | MGMT_SYSTEM_3
TEST5 | 5555 | SUSIE  | 1.1.1.5 | 1/19/2011 01:00:00 | MGMT_SYSTEM_1

Итак, я хочу запросить эту основную таблицу и получить только последнюю запись (на основе LASTUPDATE), чтобы получить самую свежую информацию об этой системе. Проблема в том, что в каждой базе данных может быть одна система, но, конечно, они никогда не будут иметь одинаковое точное время обновления.

Я бы ожидал получить что-то вроде этого:

TEST1 | 1111 | PETER | 1.1.1.11 | 1/19/2011 01:00:00 | MGMT_SYSTEM_3
TEST2 | 2222 | GEORGE | 1.1.1.2 | 1/17/2011 01:00:00 | MGMT_SYSTEM_1
TEST3 | 3333 | TOM | 1.1.1.3 | 1/19/2011 01:00:00 | MGMT_SYSTEM_2
TEST4 | 4444 | MIKE   | 1.1.1.41 | 1/19/2011 01:00:00 | MGMT_SYSTEM_3
TEST5 | 5555 | SUSIE  | 1.1.1.5 | 1/19/2011 01:00:00 | MGMT_SYSTEM_1

Я попытался использовать функцию MAX, но с этим я могу получить только один столбец. И я не могу использовать это в подзапросе, потому что у меня нет уникального поля идентификатора, которое дало бы мне последнюю обновленную запись. Одной из систем является база данных MySQL, и функция MAX в MySQL фактически будет работать так, как мне нужно, только возвращая одну запись на один GROUP BY, но она не работает в SQL Server.

Я думаю, мне нужно использовать MAX и LEFT JOIN, но мои попытки пока не увенчались успехом.

Ваша помощь будет принята с благодарностью. Последние 3-4 часа я ломал голову, пытаясь получить рабочий запрос. Эта основная таблица находится на сервере SQL Server 2005.

Спасибо!

Ответы [ 2 ]

52 голосов
/ 20 января 2011
;with cteRowNumber as (
    select COMPUTERNAME, SERIALNUMBER, USERNAME, LASTIP, LASTUPDATE, SOURCE,
           row_number() over(partition by COMPUTERNAME order by LASTUPDATE desc) as RowNum
        from YourTable
)
select COMPUTERNAME, SERIALNUMBER, USERNAME, LASTIP, LASTUPDATE, SOURCE
    from cteRowNumber
    where RowNum = 1
9 голосов
/ 18 мая 2018

В SQL Server наиболее эффективным решением часто является коррелированный подзапрос:

select t.*
from t
where t.lastupdate = (select max(t2.lastupdate)
                      from t t2
                      where t2.computername = t.computername
                     );

В частности, это может использовать индекс на (computername, lastupdate).Концептуально, причина этого быстрее, чем row_number(), в том, что этот запрос просто отфильтровывает строки, которые не совпадают.Версия row_number() должна быть прикреплена к номеру строки для всех строк, прежде чем она будет отфильтрована - это дополнительная обработка данных.

...