SQL Optimize - из таблицы истории получают значения из двух разных дат - PullRequest
3 голосов
/ 20 августа 2011

Не знаю, с чего начать ... Но в основном у меня есть таблица отчетов, таблица счетов и таблица истории счетов.Таблица истории учетной записи будет иметь ноль или более записей, где каждая запись - это состояние флага отмены учетной записи после его изменения.Есть и другие вещи, но в основном я хочу вернуть подробные данные счета, бит состояния отмены счета на дату начала и дату окончания в виде разных столбцов.

Как лучше всегосделать это?

У меня есть следующий рабочий запрос ниже

( Идея ) Должен ли я делать отдельные объединения в таблице истории, 1 для каждой даты?

Я думаю, я мог бы сделать это в трех отдельных запросах (Получить снимок начала, Завершить снимок, запрос обычного отчета с объединением каждого снимка)

что-то еще?

Ожидаемый результат:

AccountID, OtherData, StartDateCancelled, EndDateCancelled

Тестовые таблицы:

DECLARE @Report TABLE (ReportID INT, StartDate DATETIME, EndDate DATETIME)
DECLARE @ReportAccountDetail TABLE( ReportID INT, Accountid INT, Cancelled BIT )
DECLARE @AccountHistory TABLE( AccountID INT, ModifiedDate DATETIME, Cancelled BIT )

INSERT INTO @Report
SELECT 1,'1/1/2011', '2/1/2011'
--
INSERT INTO @ReportAccountDetail
SELECT 1 AS ReportID, 1 AS AccountID, 0 AS Cancelled
UNION
SELECT 1,2,0
UNION
SELECT 1,3,1
UNION
SELECT 1,4,1
--
INSERT INTO @AccountHistory
SELECT 2 AS CustomerID, '1/2/2010' AS ModifiedDate, 1 AS Cancelled
UNION--
SELECT 3, '2/1/2011', 1
UNION--
SELECT 4, '1/1/2010', 1
UNION
SELECT 4, '2/1/2010', 0
UNION
SELECT 4, '2/1/2011', 1

Текущий запрос:

SELECT Accountid, OtherData,
 MAX(CASE WHEN BeginRank = 1 THEN CASE WHEN BeginHistoryExists = 1 THEN HistoryCancelled ELSE DefaultCancel END ELSE NULL END ) AS StartDateCancelled,
 MAX(CASE WHEN EndRank = 1 THEN CASE WHEN EndHistoryExists = 1 THEN HistoryCancelled ELSE DefaultCancel END ELSE NULL END ) AS EndDateCancelled
FROM
(
SELECT c.Accountid,
'OtherData' AS OtherData,
--lots of other data
ROW_NUMBER() OVER (PARTITION BY c.AccountID ORDER BY
    CASE WHEN ch.ModifiedDate <= Report.StartDate THEN 1 ELSE 0 END DESC, ch.ModifiedDate desc) AS BeginRank,
CASE WHEN ch.ModifiedDate <= Report.StartDate THEN 1 ELSE 0 END AS BeginHistoryExists,
ROW_NUMBER() OVER ( PARTITION BY c.AccountID ORDER BY
    CASE WHEN ch.ModifiedDate <= Report.EndDate THEN 1 ELSE 0 END DESC, ch.ModifiedDate desc) AS EndRank,
CASE WHEN ch.ModifiedDate <= Report.EndDate THEN 1 ELSE 0 END AS EndHistoryExists,
    CAST( ch.Cancelled AS INT) AS HistoryCancelled,
    0 AS DefaultCancel
FROM
@Report AS Report
INNER JOIN @ReportAccountDetail AS C ON Report.ReportID = C.ReportID
--Others joins related for data to return
LEFT JOIN @AccountHistory AS CH ON CH.AccountID = C.AccountID
WHERE Report.ReportID = 1
) AS x
GROUP BY AccountID, OtherData

Приветственный ввод при написании вопросов переполнения стека.Спасибо!

1 Ответ

4 голосов
/ 20 августа 2011

ROW_NUMBER () часто удивляет меня и превосходит мои ожидания.В этом случае, однако, я хотел бы просто использовать коррелированные подзапросы.По крайней мере, я бы проверил их на соответствие альтернативам.

Примечание: я бы также использовал реальные таблицы с реальными индексами и реалистичным объемом поддельных данных.(Если стоит опубликовать этот вопрос, я предполагаю, что стоит реально проверить это.)

SELECT
  [Report].ReportID,
  [Account].AccountID,
  [Account].OtherData,
  ISNULL((SELECT TOP 1 Cancelled FROM AccountHistory WHERE AccountID = [Account].AccountID AND ModifiedDate <= [Report].StartDate ORDER BY ModifiedDate DESC), 0) AS StartDateCancelled,
  ISNULL((SELECT TOP 1 Cancelled FROM AccountHistory WHERE AccountID = [Account].AccountID AND ModifiedDate <= [Report].EndDate   ORDER BY ModifiedDate DESC), 0) AS EndDateCancelled
FROM
  Report                 AS [Report]
LEFT JOIN
  ReportAccountDetail    AS [Account]
    ON [Account].ReportID = [Report].ReportID
ORDER BY
  [Report].ReportID,
  [Account].AccountID

Примечание. По какой-то причине я обнаружил, что TOP 1 и ORDER BY быстрее, чемMAX().


С точки зрения предложенного вами ответа, я бы немного изменил его, чтобы просто использовать ISNULL вместо попытки заставить работать столбцы Exists.

Я бы также включил «другие данные» после всей обработки, а не внутри самого внутреннего запроса, чтобы избежать необходимости группировать по всем «другим данным».

WITH
  HistoricData AS
(
  SELECT
    Report.ReportID,
    c.Accountid,
    c.OtherData,
    ROW_NUMBER() OVER (PARTITION BY c.ReportID, c.AccountID ORDER BY CASE WHEN ch.ModifiedDate <= Report.StartDate THEN 1 ELSE 0 END DESC, ch.ModifiedDate DESC) AS BeginRank,
    ROW_NUMBER() OVER (PARTITION BY c.ReportID, c.AccountID ORDER BY ch.ModifiedDate DESC) AS EndRank,
    CH.Cancelled
  FROM
    @Report AS Report
  INNER JOIN
    @ReportAccountDetail AS C
      ON Report.ReportID = C.ReportID
  LEFT JOIN
    @AccountHistory AS CH
      ON  CH.AccountID     = C.AccountID
      AND CH.ModifiedDate <= Report.EndDate
)
,
  FlattenedData AS
(
  SELECT
    ReportID,
    Accountid,
    OtherData,
    ISNULL(MAX(CASE WHEN BeginRank = 1 THEN Cancelled END), 0) AS StartDateCancelled,
    ISNULL(MAX(CASE WHEN EndRank   = 1 THEN Cancelled END), 0) AS EndDateCancelled
  FROM
    [HistoricData]
  GROUP BY
    ReportID,
    AccountID,
    OtherData
)
SELECT
  *
FROM
  [FlattenedData]
LEFT JOIN
  [OtherData]
    ON Whatever = YouLike
WHERE
  [FlattenedData].ReportID = 1


И окончательная версия ...

WITH
  ReportStartHistory AS
(
  SELECT
    *
  FROM
  (
    SELECT
      [Report].ReportID,
      ROW_NUMBER() OVER (PARTITION BY [Report].ReportID, [History].AccountID ORDER BY [History].ModifiedDate) AS SequenceID,
      [History].*
    FROM
      Report                 AS [Report]
    INNER JOIN
      AccountHistory         AS [History]
        ON [History].ModifiedDate <= [Report].StartDate
  )
    AS [data]
  WHERE
    SequenceID = 1
)
,
  ReportEndHistory AS
(
  SELECT
    *
  FROM
  (
    SELECT
      [Report].ReportID,
      ROW_NUMBER() OVER (PARTITION BY [Report].ReportID, [History].AccountID ORDER BY [History].ModifiedDate) AS SequenceID,
      [History].*
    FROM
      Report                 AS [Report]
    INNER JOIN
      AccountHistory         AS [History]
        ON [History].ModifiedDate <= [Report].EndDate
  )
    AS [data]
  WHERE
    SequenceID = 1
)
SELECT
  [Report].ReportID,
  [Account].*,
  ISNULL([ReportStartHistory].Cancelled, 0) AS StartDateCancelled,
  ISNULL([ReportEndHistory].Cancelled,   0) AS EndDateCancelled
FROM
  Report                     AS [Report]
INNER JOIN
  Account                    AS [Account]
LEFT JOIN
  [ReportStartHistory]
    ON  [ReportStartHistory].ReportID  = [Report].ReportID
    AND [ReportStartHistory].AccountID = [Account].AccountID
LEFT JOIN
  [ReportEndHistory]
    ON  [ReportEndHistory].ReportID    = [Report].ReportID
    AND [ReportEndHistory].AccountID   = [Account].AccountID
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...