Оптимизация запроса mysqli для вычисления медианы с использованием GROUP BY & ORDER BY - PullRequest
0 голосов
/ 26 июня 2018

Ниже приведен пример части моей таблицы MySQL:

имя таблицы: eb_tickets

+-------------------+----------------------+
|  ticket_type      |  time_first_response |
|  Standard Traffic |  0:18:14             |
|  Standard Traffic |  0:48:06             |
|  Miscellaneous    |  44:12:23            |
|  Feed             |  4:48:22             | 
|  Miscellaneous    |  15:33:20            |
|  Banners          |  21:00:02            |
|  Integration      |  36:00:02            |
+-------------------+----------------------+

Я хочу вывести ответ следующим образом, вычисляя среднее значение с различными значениями ASC:

+-------------------+----------------------+
|  median_group     |  median              | 
|  Banners          |  21:00:02            |
|  Feed             |  4:48:22             | 
|  Integration      |  36:00:02            |
|  Miscellaneous    |  32:36:13            |
|  Standard Traffic |  0:33:10             |
+-------------------+----------------------+

В настоящее время я достигаю этого с помощью следующего запроса:


    SET @row_number:=0; 
    SET @median_group:='';

    SELECT 
        median_group, AVG(time_first_response) AS median
    FROM
    (SELECT 
        @row_number:=CASE
            WHEN @median_group = ticket_type THEN @row_number + 1
            ELSE 1
        END AS count_of_group,
        @median_group:=ticket_type AS median_group,
        ticket_type,
        time_first_response,
        (SELECT 
                COUNT(*)
            FROM
                eb_tickets
            WHERE
                a.ticket_type = ticket_type) AS total_of_group 
    FROM
        (SELECT 
            ticket_type, time_first_response
        FROM
            eb_tickets           
        ORDER BY ticket_type, time_first_response) AS a) AS b
        WHERE
        count_of_group BETWEEN total_of_group / 2.0 AND total_of_group / 2.0 +1
        GROUP BY median_group

К сожалению, этот запрос занимает около 1 секунды для каждой записи, и я запрашиваю тысячи записей с возможностью 20 различных значений для столбца ticket_type.

Я прошу помочь выяснить, можно ли оптимизировать мой текущий запрос, чтобы ускорить выполнение запроса.

Спасибо за вашу помощь!

1 Ответ

0 голосов
/ 28 июня 2018

Не могли бы вы попробовать вот так?

SELECT counter.ticket_type,AVG(time_first_response) AS median FROM
  (
    SELECT 
      IF(@type = type, @ctr := @ctr + 1, @ctr := 1) AS rownum, 
      @type := ticket_type AS ticket_type,
      time_first_response
    FROM eb_tickets
    ORDER BY ticket_type,time_first_response
  ) AS counter,
  (
    SELECT ticket_type, COUNT(*) AS rows
    FROM eb_tickets
    GROUP BY ticket_type
  ) AS types
  WHERE types.ticket_type = counter.ticket_type AND
    CASE rows % 2 
      WHEN 1 THEN rownum IN (ROUND(rows / 2),ROUND(rows / 2))
      ELSE rownum IN (ROUND(rows / 2),ROUND(rows / 2) + 1)
    END
  GROUP BY counter.ticket_type

EDIT:

Первоначально, когда я экспериментировал с SQL, я использовал более короткие имена для столбцов - type вместо ticket_type, а подзапрос counter был оставлен с неправильным именем столбца type вместо ticket_type

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...