Почему выбирают Top X Kill Performance - PullRequest
4 голосов
/ 08 января 2011

У меня есть запрос T-SQL ниже (сгенерированный linq-to-sql, поэтому он выглядит немного странно.) Когда я удаляю первые 10, он запускается менее чем за 1 секунду.Когда я оставляю топ-10, это занимает 68 секунд.

Без топ-10 общее количество строк составляет всего 19.

Почему топ-10 так сильно снижает производительность в этой ситуации?

SELECT TOP (10) [t3].[value] AS [StartDate], [t3].[AH_TimeStamp4] AS [EndDate], [t3].[value2] AS [RunTime], [t3].[AH_Idnr] AS [RunNumber], [t3].[AH_Status] AS [StatusCode], [t3].[STATUS_DESC] AS [StatusDesc], [t3].[STATUS_TYPE] AS [StatusType]
FROM (
    SELECT COALESCE([t1].[AH_TimeStamp2],[t1].[AH_TimeStamp1]) AS [value], [t1].[AH_TimeStamp4], CONVERT(BigInt,(((CONVERT(BigInt,DATEDIFF(DAY, [t1].[AH_TimeStamp1], [t1].[AH_TimeStamp4]))) * 86400000) + DATEDIFF(MILLISECOND, DATEADD(DAY, DATEDIFF(DAY, [t1].[AH_TimeStamp1], [t1].[AH_TimeStamp4]), [t1].[AH_TimeStamp1]), [t1].[AH_TimeStamp4])) * 10000) AS [value2], [t1].[AH_Idnr], [t1].[AH_Status], [t2].[STATUS_DESC], [t2].[STATUS_TYPE], [t0].[OH_Name]
    FROM [dbo].[OH] AS [t0]
    INNER JOIN [dbo].[AH] AS [t1] ON ([t0].[OH_Idnr]) = [t1].[AH_OH_Idnr]
    INNER JOIN [dbo].[CHK_JOB_STATUS_CODE] AS [t2] ON [t1].[AH_Status] = ([t2].[STATUS_CODE])
    ) AS [t3]
WHERE [t3].[OH_Name] = @p0
ORDER BY [t3].[AH_Idnr] DESC

Редактировать -> в соответствии с запросом, это сгенерированный linq запрос без Take (10)

SELECT [t3].[value] AS [StartDate], [t3].[AH_TimeStamp4] AS [EndDate], [t3].[value2] AS [RunTime], [t3].[AH_Idnr] AS [RunNumber], [t3].[AH_Status] AS [StatusCode], [t3].[STATUS_DESC] AS [StatusDesc], [t3].[STATUS_TYPE] AS [StatusType]
FROM (
    SELECT COALESCE([t1].[AH_TimeStamp2],[t1].[AH_TimeStamp1]) AS [value], [t1].[AH_TimeStamp4], CONVERT(BigInt,(((CONVERT(BigInt,DATEDIFF(DAY, [t1].[AH_TimeStamp1], [t1].[AH_TimeStamp4]))) * 86400000) + DATEDIFF(MILLISECOND, DATEADD(DAY, DATEDIFF(DAY, [t1].[AH_TimeStamp1], [t1].[AH_TimeStamp4]), [t1].[AH_TimeStamp1]), [t1].[AH_TimeStamp4])) * 10000) AS [value2], [t1].[AH_Idnr], [t1].[AH_Status], [t2].[STATUS_DESC], [t2].[STATUS_TYPE], [t0].[OH_Name]
    FROM [dbo].[OH] AS [t0]
    INNER JOIN [dbo].[AH] AS [t1] ON ([t0].[OH_Idnr]) = [t1].[AH_OH_Idnr]
    INNER JOIN [dbo].[CHK_JOB_STATUS_CODE] AS [t2] ON [t1].[AH_Status] = ([t2].[STATUS_CODE])
    ) AS [t3]
WHERE [t3].[OH_Name] = @p0
ORDER BY [t3].[AH_Idnr] DESC

Edit 2 -> вот запрос LINQ - ничего особенного, только 3 соединения

List<UC4Status> statusList = uc4DB.OHs.Where(o => o.OH_Name == jobName).Join(uc4DB.AHs, oh => oh.OH_Idnr, ah => ah.AH_OH_Idnr, (oh, ah) => ah)
                        .Join(uc4DB.CHK_JOB_STATUS_CODEs, ah => ah.AH_Status, job => job.STATUS_CODE, (a, s) =>
                            new UC4Status
                            {
                                StartDate = a.AH_TimeStamp2 ?? a.AH_TimeStamp1,
                                EndDate = a.AH_TimeStamp4,
                                RunTime = a.AH_TimeStamp4 - a.AH_TimeStamp1,
                                StatusType = s.STATUS_TYPE,
                                StatusDesc = s.STATUS_DESC,
                                StatusCode = a.AH_Status,
                                RunNumber = a.AH_Idnr
                            }).OrderByDescending(r => r.RunNumber).Take(maxResults).ToList();

Ответы [ 2 ]

2 голосов
/ 08 января 2011

Более важным, чем количество возвращаемых строк, является число строк в каждой объединенной таблице.Без доступа к плану запросов трудно сказать, в чем проблема.Но проблема может быть связана с устаревшей или отсутствующей статистикой столбцов в сочетании с отсутствием хороших индексов, из-за чего оптимизатор запросов принимает очень плохое решение при использовании top.Например, если оптимизатор неверно полагает, что оператор top будет работать только с небольшим количеством строк в каждой объединенной таблице, он может выбрать использование соединений внутреннего цикла с проверками таблиц в каждой объединенной таблице, что может бытьужасно медленная операция с большим количеством записей (но может работать очень эффективно при работе только с несколькими записями).В случае без top оптимизатор мог бы правильно предположить, что ему придется сканировать большой объем записей в объединенных таблицах, и использовать подход, который лучше подходит для такой операции, например, соединение с совпадением хеша при сканировании таблицы.

Вы можете попробовать обновить статистику и добавить другие индексы, чтобы посмотреть, поможет ли это.

0 голосов
/ 08 января 2011

Сколько строк без 10 лучших? Есть ли какие-либо индексы реализованы? Я предполагаю, что это связано с объединениями подзапросов t0, t1 и t2 ... Можете ли вы попробовать что-то вроде,


select top 10 * from (
  select t3.value....
  from ( 
    select coalesce... )
  where ... order by ... 
)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...