T-SQL: ВЫБЕРИТЕ посты, где тренд направлен вниз в течение двух периодов времени - PullRequest
0 голосов
/ 24 мая 2018

Я хочу избегать подвыбора в таблице для сравнения двух периодов и, если тренд нисходящий.

Этот выбор получает процент за один период

SELECT user, (SUM(value1)/SUM(value2)) AS percentage1
FROM table
WHERE (date BETWEEN @start1 AND @end1)
GROUP BY user
ORDER BY 2

Этот запросполучает результат, который мне нужен, но он не очень эффективен, потому что в нем более 100 миллионов строк.

SELECT t1.user, (SUM(t1.value1)/SUM(t1.value2)) AS percentage1,
(SELECT (SUM(t2.value1)/SUM(t2.value2)) AS percentage2
FROM table AS t2
WHERE t2.userID = t1.userID
AND (t2.date BETWEEN @start2 AND @end2)
)
FROM table AS t1
WHERE (t1.date BETWEEN @start1 AND @end1)
AND (SUM(t1.value1)/SUM(t1.value2)) < (SELECT (SUM(t2.value1)/SUM(t2.value2))
FROM table AS t2
WHERE t2.userID = t1.userID
AND (t2.date BETWEEN @start2 AND @end2)
)
GROUP BY t1.user

Есть ли лучший способ сделать это?Одним из решений может быть просто иметь период даты, а затем группировать по месяцу (дата), году (дате) и сравнивать с предыдущим месяцем вместо двух точных дат.Но группировка по месяцу и году просто дает несколько строк для каждого пользователя, и этого я хочу избежать.

Просто хочу получить чистый результат, подобный этому:

Adam, 43%, 47%
Lisa, 22%, 25%
John, 18%, 34%

Исключая строки, подобные этой, потому что трендэто меньший процент

Bill, 24%, 18%
Nina, 84%, 56%

SQL-Server 2016 Enterprise - это БД.

Ответы [ 2 ]

0 голосов
/ 29 мая 2018

Мы можем попробовать использовать подход CTE, обеспечивающий большую читаемость и гибкость для модификаций, если потребуется в будущем.Я добавил индексы в столбец RequiredDate для повышения производительности.Надеюсь, это поможет.

IF OBJECT_ID('dbo.InputUsers') IS NULL
BEGIN
CREATE TABLE dbo.InputUsers (
UserNameID INT NOT NULL,
UserName NVARCHAR(MAX),
RequiredDate DATETIME,
Value1 DECIMAL,
Value2 DECIMAL
)
CREATE NONCLUSTERED INDEX IX_Users_RequiredDate   
    ON dbo.InputUsers (RequiredDate);   
END

DECLARE @Start1 NVARCHAR(20), @End1 NVARCHAR(20), @Start2 NVARCHAR(20), @End2 NVARCHAR(20)
SET @Start1 = '2018-05-26'
SET @End1 = '2018-05-27'

SET @Start2 = '2018-05-28'
SET @End2 = '2018-05-29'

INSERT INTO InputUsers(UserNameID, UserName, RequiredDate, Value1, Value2) VALUES
(1, 'Adam', '2018-05-29', 13, 25),
(1, 'Adam', '2018-05-28', 12, 25),
(1, 'Adam', '2018-05-27', 11, 25),
(1, 'Adam', '2018-05-26', 10, 25),

(2, 'Lisa', '2018-05-29', 19, 25),
(2, 'Lisa', '2018-05-28', 18, 25),
(2, 'Lisa', '2018-05-27', 17, 25),
(2, 'Lisa', '2018-05-26', 16, 25),

(3, 'John', '2018-05-29', 16, 25),
(3, 'John', '2018-05-28', 17, 25),
(3, 'John', '2018-05-27', 18, 25),
(3, 'John', '2018-05-26', 19, 25),

(4, 'Bill', '2018-05-29', 10, 25),
(4, 'Bill', '2018-05-28', 11, 25),
(4, 'Bill', '2018-05-27', 12, 25),
(4, 'Bill', '2018-05-26', 13, 25)

;WITH PercentageValues1 AS (SELECT UserNameID, UserName, SUM(Value1)*100 / SUM(Value2) AS Percentage
FROM dbo.InputUsers
WHERE RequiredDate >= @Start1 AND RequiredDate <= @End1
GROUP BY UserNameID, UserName
),
PercentageValues2 AS (SELECT UserNameID, UserName, SUM(Value1)*100 / SUM(Value2) AS Percentage
FROM dbo.InputUsers
WHERE RequiredDate >= @Start2 AND RequiredDate <= @End2
GROUP BY UserNameID, UserName
)
SELECT pv2.UserName, pv1.Percentage, pv2.Percentage
FROM PercentageValues2 pv2
LEFT JOIN PercentageValues1 pv1 ON 
pv2.UserNameID = pv1.UserNameID
WHERE pv2.Percentage > pv1.Percentage
0 голосов
/ 25 мая 2018

Вы можете попробовать это.

SELECT G1.user, G1.percentage1, G2.percentage2 
FROM 
    ( SELECT t1.user, t1.userID
        (SUM(t1.value1)/SUM(t1.value2)) AS percentage1,
      FROM table AS t1
      WHERE 
        (t1.date BETWEEN @start1 AND @end1)
      GROUP BY t1.user, t1.userID
    ) AS G1
    INNER JOIN (
        SELECT t2.userID, (SUM(t2.value1)/SUM(t2.value2)) AS percentage2
        FROM table AS t2
        WHERE 
            (t2.date BETWEEN @start2 AND @end2)
        GROUP BY t2.userID
    ) AS G2 ON G1.userID = G2.userID
WHERE 
    G1.percentage1 < G2.percentage2

Но если вы хотите использовать только один выбор из таблицы, то вы также можете попробовать это.

DECLARE @start DATE
DECLARE @end DATE

SET @start = CASE WHEN @start1 < @start2 THEN @start1 ELSE @start2 END
SET @end = CASE WHEN @end1 > @end2 THEN @end1 ELSE @end2 END

SELECT * FROM (
    SELECT t.userID, 
        SUM( CASE WHEN t.date BETWEEN @start1 AND @end1 THEN t.value1 END ) / SUM( CASE WHEN t.date BETWEEN @start1 AND @end1 THEN t.value2 END ) AS percentage1, 
        SUM( CASE WHEN t.date BETWEEN @start2 AND @end2 THEN t.value1 END ) / SUM( CASE WHEN t.date BETWEEN @start2 AND @end2 THEN t.value2 END ) AS percentage2, 
    FROM table AS t
    WHERE 
        (t.date BETWEEN @start AND @end)
    GROUP BY t.userID
) AS SQ WHERE percentage1 < percentage2
...