Проблема с предикатом, выдвигающим статистику Max и Min для каждого пользователя в группе - PullRequest
0 голосов
/ 11 августа 2011

У меня есть две таблицы в базе данных ORACLE 10g:

Таблица ПОЛЬЗОВАТЕЛЕЙ со столбцами: UserId | GroupId | Другие детали где есть 1 запись для каждого пользователя, всего 400, и там c.a. 1-10 пользователей в каждой группе.

и таблица ИСПОЛЬЗОВАНИЕ с колонками: UserId | Дата | Количество где 10000 строк для каждого пользователя. (так 400 * 10000 строк)

У меня есть таблица Users, проиндексированная по UserId, GroupId и (UserId, GroupId), а таблица использования проиндексирована (UserId, Date)

Я хочу видеть максимальное и общее количество использования для каждого пользователя в данной группе. Примерно так:

select User.UserId, maxAmount, Total from 
Users
JOIN
( select UserId,max(Amount) as maxAmount from USAGE group by UserId ) A
ON User.UserId = A.UserId
JOIN 
(  select UserId,min(Amount) as minAmount from USAGE group by UserId ) B
ON User.UserId = B.UserId
WHERE User.GroupId = 'some_group_id'

Но это очень медленно (около 20 секунд), но когда я делаю их отдельно (только Макс и только Мин, но не оба одновременно), как это:

select User.UserId, maxAmount, minAmount from 
Users
JOIN
( select UserId,max(Amount) as maxAmount from USAGE group by UserId ) A
ON User.UserId = A.UserId
WHERE User.GroupId = 'some_group_id'

он работает в одно мгновение!

Просто не имеет смысла, что я могу присоединиться к ним по отдельности очень быстро, но когда я присоединяюсь ко всем трем, это очень медленно.

Вот планы, в которых я создал встроенные представления в предыдущих операторах как фактические представления:

create view usage_min as select user_id, min(amount) from usage group by user_id;
create view usage_max as select user_id, max(amount) from usage group by user_id;




 explain plan for select * from usage_min join users using(user_id) where group_id='1212882339';
 select * from table(dbms_xplan.display);
Plan hash value: 3874246446

-----------------------------------------------------------------------------------------------------
| Id  | Operation                         | Name            | Rows  | Bytes | Cost (%CPU)| Time     |
-----------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT                  |                 |     1 |   139 |  1162   (1)| 00:00:14 |
|   1 |  HASH GROUP BY                    |                 |     1 |   139 |  1162   (1)| 00:00:14 |
|   2 |   TABLE ACCESS BY INDEX ROWID     | USAGE           |  7977 |   116K|  1157   (1)| 00:00:14 |
|   3 |    NESTED LOOPS                   |                 | 11085 |  1504K|  1160   (1)| 00:00:14 |
|   4 |     MAT_VIEW ACCESS BY INDEX ROWID| USERS           |     1 |   124 |     3   (0)| 00:00:01 |
|*  5 |      INDEX RANGE SCAN             | USERS_KT        |     1 |       |     1   (0)| 00:00:01 |
|*  6 |     INDEX RANGE SCAN              | SYS_C0099818    |  7977 |       |    79   (0)| 00:00:01 |
-----------------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

   5 - access("USERS"."group_id"='1212882339')
   6 - access("user_id"="USERS"."user_id")


  explain plan for select * from users join  usage_max   using(user_id) where group_id='1212882339';
 select * from table(dbms_xplan.display);

Plan hash value: 2384977958

-----------------------------------------------------------------------------------------------------
| Id  | Operation                         | Name            | Rows  | Bytes | Cost (%CPU)| Time     |
-----------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT                  |                 |     1 |   145 |   519   (2)| 00:00:07 |
|   1 |  HASH GROUP BY                    |                 |     1 |   145 |   519   (2)| 00:00:07 |
|   2 |   TABLE ACCESS BY INDEX ROWID     | USAGE2          | 18251 |   374K|   512   (1)| 00:00:07 |
|   3 |    NESTED LOOPS                   |                 | 25362 |  3591K|   515   (1)| 00:00:07 |
|   4 |     MAT_VIEW ACCESS BY INDEX ROWID| USERS           |     1 |   124 |     3   (0)| 00:00:01 |
|*  5 |      INDEX RANGE SCAN             | USERS_KT        |     1 |       |     1   (0)| 00:00:01 |
|*  6 |     INDEX RANGE SCAN              | T2_user_id        | 18251 |       |    25   (4)| 00:00:01 |
-----------------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

   5 - access("USERS"."group_id"='1212882339')
   6 - access("USERS"."user_id"="user_id")

 explain plan for select * from  users  join usage_max using(user_id) join  usage_min using(user_id)  where group_id='1212882339';
 select * from table(dbms_xplan.display);

Plan hash value: 3190011991

-----------------------------------------------------------------------------------------------------
| Id  | Operation                         | Name            | Rows  | Bytes | Cost (%CPU)| Time     |
-----------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT                  |                 |   100 | 16600 |  6782  (19)| 00:01:22 |
|*  1 |  HASH JOIN                        |                 |   100 | 16600 |  6782  (19)| 00:01:22 |
|   2 |   MERGE JOIN                      |                 |   100 | 14500 |  3176  (19)| 00:00:39 |
|   3 |    SORT JOIN                      |                 |  2920K|    58M|  3172  (19)| 00:00:39 |
|   4 |     VIEW                          | USAGE_MAX       |  2920K|    58M|  3172  (19)| 00:00:39 |
|   5 |      HASH GROUP BY                |                 |  2920K|    58M|  3172  (19)| 00:00:39 |
|   6 |       TABLE ACCESS FULL           | USAGE2          |  2920K|    58M|  2686   (5)| 00:00:33 |
|*  7 |    SORT JOIN                      |                 |     1 |   124 |     4  (25)| 00:00:01 |
|   8 |     MAT_VIEW ACCESS BY INDEX ROWID| USERS           |     1 |   124 |     3   (0)| 00:00:01 |
|*  9 |      INDEX RANGE SCAN             | USERS_KT        |     1 |       |     1   (0)| 00:00:01 |
|  10 |   VIEW                            | USAGE_MIN       |   398 |  8358 |  3605  (19)| 00:00:44 |
|  11 |    HASH GROUP BY                  |                 |   398 |  5970 |  3605  (19)| 00:00:44 |
|  12 |     TABLE ACCESS FULL             | USAGE           |  3174K|    45M|  3073   (4)| 00:00:37 |
-----------------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

   1 - access("USAGE_MAX"."user_id"="USAGE_MIN"."user_id")
   7 - access("USERS"."user_id"="USAGE_MAX"."user_id")
       filter("USERS"."user_id"="USAGE_MAX"."user_id")
   9 - access("USERS"."group_id"='1212882339')

1 Ответ

1 голос
/ 11 августа 2011
  • Какие планы запроса?
  • Вы измеряете время для извлечения первого ряда? Или вы измеряете время для извлечения последнего ряда?

Как минимум, я бы хотел попасть в таблицу USAGE всего один раз, используя что-то вроде

select User.UserId, maxAmount, Total from 
Users
JOIN
( select UserId,
         max(Amount) as maxAmount,
         sum(Amount) as Total
    from USAGE group by UserId ) A
ON User.UserId = A.UserId
WHERE User.GroupId = 'some_group_id'

или даже проще

SELECT user.userId,
       max(usage.Amount) maxAmount,
       sum(usage.Amount) total
  FROM user
       join usage on (user.userId = usage.userId)
 WHERE user.GroupId = 'some_group_id'
 GROUP BY user.userId
...