Расчет процентов с помощью запроса GROUP BY - PullRequest
30 голосов
/ 02 июня 2011

У меня есть таблица с 3 столбцами, которая выглядит следующим образом:

File    User     Rating (1-5)
------------------------------
00001    1        3
00002    1        4
00003    2        2
00004    3        5
00005    4        3
00005    3        2
00006    2        3
Etc.

Я хочу создать запрос, который выводит следующее (для каждого пользователя и рейтинга отображается количество файлов, а также процент файлов):

User    Rating   Count   Percentage
-----------------------------------
1       1         3      .18
1       2         6      .35
1       3         8      .47
2       5         12     .75
2       3         4      .25

С Postgresql я знаю, как создать запрос, который включает первые 3 столбца, используя следующий запрос, но я не могу понять, как рассчитать процент в GROUP BY:

SELECT
    User,
    Rating,
    Count(*)
FROM
    Results
GROUP BY
    User, Rating
ORDER BY
    User, Rating

Здесь я хочу, чтобы процентный расчет применялся к каждому пользователю / группе рейтингов.

Ответы [ 4 ]

28 голосов
/ 02 июня 2011
WITH t1 AS 
 (SELECT User, Rating, Count(*) AS n 
  FROM your_table
  GROUP BY User, Rating)
SELECT User, Rating, n, 
       (0.0+n)/(COUNT(*) OVER (PARTITION BY User)) -- no integer divide!
FROM t1;

Или

SELECT User, Rating, Count(*) OVER w_user_rating AS n, 
        (0.0+Count(*) OVER w_user_rating)/(Count(*) OVER (PARTITION BY User)) AS pct
FROM your_table
WINDOW w_user_rating AS (PARTITION BY User, Rating);

Я бы посмотрел, если один из этих или другого дает лучший план запроса с соответствующим инструментом для вашей СУБД.

8 голосов
/ 02 июня 2011

В качестве альтернативы, вы можете поступить по-старому - возможно, проще за что-то ухватиться:

select usr.User                   as User   ,
       usr.Rating                 as Rating ,
       usr.N                      as N      ,
       (100.0 * item.N) / total.N as Pct
from ( select User, Rating , count(*) as N
       from Results
       group by User , Rating
     ) usr
join ( select User , count(*) as N
       from Results
       group by User
     ) total on total.User = usr.User
order by usr.User, usr.Rating

Приветствия!

5 голосов
/ 02 июня 2011

Лучший способ сделать это - оконные функции .

0 голосов
/ 10 июля 2019
WITH data AS 
 (SELECT User, Rating, Count(*) AS Count 
  FROM Results
  GROUP BY User, Rating)
SELECT User, Rating, Count, 
       (0.0+n)/(SUM(Count) OVER (PARTITION BY User))
FROM data;
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...