хотя у меня хорошие показатели
Без обид, но давайте будем судить об этом. Всегда публикуйте схему точную для своих таблиц, включая все индексы и количество элементов, при задании вопросов производительности SQL Server.
Например, давайте рассмотрим следующую структуру таблицы:
create table tblSequence (
[UserSessionSequenceID] int not null
,[SessionGuid] uniqueidentifier not null
,[SiteID] int not null
,[Timestamp] datetime not null
, filler varchar(512));
go
create clustered index cdxSequence on tblSequence (SiteID, [Timestamp]);
go
, который совпадает с вашим, но все поля, не относящиеся к проблемам производительности, объединяются в общий заполнитель. Давайте посмотрим, насколько плоха производительность, скажем, для 1М строк примерно для 50 тыс. Сеансов? Давайте заполним таблицу случайными данными, но мы смоделируем, что означает «активность пользователя»:
set nocount on;
declare @i int = 0, @sc int = 1;
declare @SessionGuid uniqueidentifier = newid()
, @siteID int = 1
, @Timestamp datetime = dateadd(day, rand()*1000, '20070101')
, @UserSessionSequenceID int = 0;
begin tran;
while @i<1000000
begin
insert into tblSequence (
[UserSessionSequenceID]
,[SessionGuid]
,[SiteID]
,[Timestamp]
, filler)
values (
@UserSessionSequenceID
, @SessionGuid
, @siteID
, @timestamp
, replicate('X', rand()*512));
if rand()*100 < 5
begin
set @SessionGuid = newid();
set @siteID = rand() * 10;
set @Timestamp = dateadd(day, rand()*1000, '20070101');
set @UserSessionSequenceID = 0;
set @sc += 1;
end
else
begin
set @timestamp = dateadd(second, rand()*300, @timestamp);
set @UserSessionSequenceID += 1;
end
set @i += 1;
if (@i % 1000) = 0
begin
raiserror(N'Inserted %i rows, %i sessions', 0, 1, @i, @sc);
commit;
begin tran;
end
end
commit;
Это займет около 1 минуты, чтобы заполнить. Теперь давайте сделаем запрос на тот же запрос, который вы задавали: каково последнее действие любого сеанса пользователя на сайте X за последние Y минут? Мне придется использовать конкретную дату для @now вместо GETDATE (), потому что emy dtaa моделируется, а не реально, поэтому я использую любую метку максимального времени, которая была заполнена случайным образом для SiteId 1:
set statistics time on;
set statistics io on;
declare @resultCount int = 30;
declare @minutes int = 60*24;
declare @siteID int = 1;
declare @now datetime = '2009-09-26 02:08:27.000';
SELECT TOP(@resultCount) * FROM
(
SELECT
[UserSessionSequenceID]
,[SessionGuid]
, SiteID
, Filler
,[Timestamp]
,ROW_NUMBER() over (PARTITION BY [SessionGuid]
ORDER BY UserSessionSequenceID DESC) AS sort
FROM [tblSequence]
where SiteID = @siteID
and [Timestamp] > DATEADD(mi, -@minutes, @now)
) AS t
WHERE sort = 1
ORDER BY [UserSessionSequenceID] DESC ;
Это тот же запрос, что и у вас, но ограничительные фильтры перемещены в подзапрос части ROW_NUMBER (). Результаты возвращаются в:
Table 'tblSequence'. Scan count 1, logical reads 12, physical reads 0.
SQL Server Execution Times:
CPU time = 0 ms, elapsed time = 31 ms.
Время отклика 31 мс в теплом кэше, из почти 60 тыс. Страниц таблицы читается 12 страниц.
Обновлено
После прочтения исходного запроса я понимаю, что мой измененный запрос отличается. Вам нужно только новых сеансов. Я по-прежнему считаю, что фильтрация по SiteID и Timestmap - это единственный способ получить необходимую производительность, поэтому решение заключается в проверке найденных кандидатов с условием NOT EXISTS:
SELECT TOP(@resultCount) * FROM
(
SELECT
[UserSessionSequenceID]
,[SessionGuid]
, SiteID
, Filler
,[Timestamp]
,ROW_NUMBER() over (
PARTITION BY [SessionGuid]
ORDER BY UserSessionSequenceID DESC)
AS sort
FROM [tblSequence]
where SiteID = @siteID
and [Timestamp] > DATEADD(mi, -@minutes, @now)
) AS new
WHERE sort = 1
and not exists (
select SessionGuid
from tblSequence
where SiteID = @siteID
and SessionGuid = new.SessionGuid
and [TimeStamp] < DATEADD(mi, -@minutes, @now)
)
ORDER BY [UserSessionSequenceID] DESC
Это возвращается на моем ноутбуке, для 1M строк более 400 тыс. Сеансов за 40 мс из горячего кэша:
Table 'Worktable'. Scan count 0, logical reads 0, physical reads 0
Table 'tblSequence'. Scan count 2, logical reads 709, physical reads 0
SQL Server Execution Times:
CPU time = 16 ms, elapsed time = 40 ms.