Возвратите счет за каждый час за последние 24 часа, заполнив пробелы нулями - PullRequest
0 голосов
/ 11 января 2019

Я пытаюсь получить набор записей с количеством продаж за каждый час за последние 24 часа, заполняя пустые часы нулями.

Мой пример набора данных выглядит следующим образом и содержит две строки теста:

id | saleID            | amount      | created
---|-------------------|-------------|-------------
1  | 6032b317-1533...  | 20000       | 2019-01-10 23:56:40
2  | 43556fg6-5344...  | 60000       | 2019-01-11 18:06:32

Текущее время, например, 18:10, поэтому я ищу результат:

| hourOrderID | saleHour | saleHourTotal |
| ----------- | -------- | ------------- |
| 1           | 18:00    | 1             |
| 2           | 17:00    | 0             |
| 3           | 16:00    | 0             |
| 4           | 15:00    | 0             |
| 5           | 14:00    | 0             |
| 6           | 13:00    | 0             |
| 7           | 12:00    | 0             |
| 8           | 11:00    | 0             |
| 9           | 10:00    | 0             |
| 10          | 9:00     | 0             |
| 11          | 8:00     | 0             |
| 12          | 7:00     | 0             |
| 13          | 6:00     | 0             |
| 14          | 5:00     | 0             |
| 15          | 4:00     | 0             |
| 16          | 3:00     | 0             |
| 17          | 2:00     | 0             |
| 18          | 1:00     | 0             |
| 19          | 0:00     | 0             |
| 20          | 23:00    | 1             |
| 21          | 22:00    | 0             |
| 22          | 21:00    | 0             |
| 23          | 20:00    | 0             |
| 24          | 19:00    | 0             |
| 25          | 18:00    | 0             |

Обратите внимание; сегодня между 18: 00-19: 00 была 1 продажа, а между 18: 00-19: 00 вчера было 0. Это моя проблема.

Результат, который я на самом деле получаю:

| hourOrderID | saleHour | saleHourTotal |
| ----------- | -------- | ------------- |
| 1           | 18:00    | 1             |
| 2           | 17:00    | 0             |
| 3           | 16:00    | 0             |
| 4           | 15:00    | 0             |
| 5           | 14:00    | 0             |
| 6           | 13:00    | 0             |
| 7           | 12:00    | 0             |
| 8           | 11:00    | 0             |
| 9           | 10:00    | 0             |
| 10          | 9:00     | 0             |
| 11          | 8:00     | 0             |
| 12          | 7:00     | 0             |
| 13          | 6:00     | 0             |
| 14          | 5:00     | 0             |
| 15          | 4:00     | 0             |
| 16          | 3:00     | 0             |
| 17          | 2:00     | 0             |
| 18          | 1:00     | 0             |
| 19          | 0:00     | 0             |
| 20          | 23:00    | 1             |
| 21          | 22:00    | 0             |
| 22          | 21:00    | 0             |
| 23          | 20:00    | 0             |
| 24          | 19:00    | 0             |
| 25          | 18:00    | 1             | <----- this isn't yesterday, it's today

Запрос, над которым я работал:

SELECT
    aux.id AS hourOrderID,
    CONCAT(aux.dh, ':00') AS saleHour,
    COALESCE(COUNT(ets.saleID), 0) AS saleHourTotal
FROM eventTicketSales AS ets 
RIGHT JOIN (
    SELECT 1 AS id, HOUR(UTC_TIMESTAMP()) AS dh UNION
    SELECT 2 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 1 HOUR)) AS dh UNION
    SELECT 3 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 2 HOUR)) AS dh UNION
    SELECT 4 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 3 HOUR)) AS dh UNION
    SELECT 5 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 4 HOUR)) AS dh UNION
    SELECT 6 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 5 HOUR)) AS dh UNION
    SELECT 7 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 6 HOUR)) AS dh UNION
    SELECT 8 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 7 HOUR)) AS dh UNION
    SELECT 9 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 8 HOUR)) AS dh UNION
    SELECT 10 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 9 HOUR)) AS dh UNION
    SELECT 11 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 10 HOUR)) AS dh UNION
    SELECT 12 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 11 HOUR)) AS dh UNION
    SELECT 13 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 12 HOUR)) AS dh UNION
    SELECT 14 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 13 HOUR)) AS dh UNION
    SELECT 15 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 14 HOUR)) AS dh UNION
    SELECT 16 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 15 HOUR)) AS dh UNION
    SELECT 17 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 16 HOUR)) AS dh UNION
    SELECT 18 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 17 HOUR)) AS dh UNION
    SELECT 19 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 18 HOUR)) AS dh UNION
    SELECT 20 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 19 HOUR)) AS dh UNION
    SELECT 21 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 20 HOUR)) AS dh UNION
    SELECT 22 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 21 HOUR)) AS dh UNION
    SELECT 23 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 22 HOUR)) AS dh UNION
    SELECT 24 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 23 HOUR)) AS dh UNION
    SELECT 25 AS id, HOUR(DATE_SUB(UTC_TIMESTAMP(), INTERVAL 24 HOUR)) AS dh
) AS aux ON HOUR(ets.created) = aux.dh
         AND ets.created > DATE_SUB(UTC_TIMESTAMP, INTERVAL 24 HOUR)
GROUP BY aux.id, aux.dh
ORDER BY hourOrderID

И вы можете поиграться с моими битами здесь : o

Мне бы хотелось, чтобы последний час в сете был с предыдущего дня, но мой мозг решил, что он не может идти дальше и нуждается в помощи.

Я пытался добавить еще UNION на 25-й час, а также пытался увеличить временной интервал до 25 часов, но результаты были далеки от того, что я хотел:

AND ets.created > DATE_SUB(UTC_TIMESTAMP, INTERVAL 25 HOUR

Пожалуйста, предложите, что можно изменить, чтобы сделать эту работу ожидаемой.

Ответы [ 2 ]

0 голосов
/ 12 января 2019

(В целях синтаксиса я предполагаю, что вы используете MySQL.)

Чтобы получить 25 строк данных из одного оператора SELECT, вам нужна таблица (реальная или поддельная), содержащая 25 строк, что в точности соответствует тому, что сделал ваш внутренний SELECT. Прежде чем показывать более простой способ создания внутренней таблицы, я бы предложил добавить в нее еще несколько столбцов (при условии, что текущее время 31 декабря - 6 часов вечера):

| hourOrderID | saleHour | startTime        | endTime          |
| ----------- | -------- | ---------------- | ---------------- |
| 1           | 18:00    | 2019-01-10 18:00 | 2019-01-10 19:00 |
| 2           | 17:00    | 2019-01-10 17:00 | 2019-01-10 18:00 |
| 3           | 16:00    | 2019-01-10 16:00 | 2019-01-10 17:00 |
| 4           | 15:00    | 2019-01-10 15:00 | 2019-01-10 16:00 |
| 5           | 14:00    | 2019-01-10 14:00 | 2019-01-10 15:00 |
| 6           | 13:00    | 2019-01-10 13:00 | 2019-01-10 14:00 |
| 7           | 12:00    | 2019-01-10 12:00 | 2019-01-10 13:00 |
| 8           | 11:00    | 2019-01-10 11:00 | 2019-01-10 12:00 |
| 9           | 10:00    | 2019-01-10 10:00 | 2019-01-10 11:00 |
| 10          | 9:00     | 2019-01-10 09:00 | 2019-01-10 10:00 |
| 11          | 8:00     | 2019-01-10 08:00 | 2019-01-10 09:00 |
| 12          | 7:00     | 2019-01-10 07:00 | 2019-01-10 08:00 |
| 13          | 6:00     | 2019-01-10 06:00 | 2019-01-10 07:00 |
| 14          | 5:00     | 2019-01-10 05:00 | 2019-01-10 06:00 |
| 15          | 4:00     | 2019-01-10 04:00 | 2019-01-10 05:00 |
| 16          | 3:00     | 2019-01-10 03:00 | 2019-01-10 04:00 |
| 17          | 2:00     | 2019-01-10 02:00 | 2019-01-10 03:00 |
| 18          | 1:00     | 2019-01-10 01:00 | 2019-01-10 02:00 |
| 19          | 0:00     | 2019-01-10 00:00 | 2019-01-10 01:00 |
| 20          | 23:00    | 2019-01-09 23:00 | 2019-01-10 00:00 |
| 21          | 22:00    | 2019-01-09 22:00 | 2019-01-09 23:00 |
| 22          | 21:00    | 2019-01-09 21:00 | 2019-01-09 22:00 |
| 23          | 20:00    | 2019-01-09 20:00 | 2019-01-09 21:00 |
| 24          | 19:00    | 2019-01-09 19:00 | 2019-01-09 20:00 |
| 25          | 18:00    | 2019-01-09 18:00 | 2019-01-09 19:00 |

Тогда ваш запрос будет довольно простым:

SELECT
    aux.hourOrderID,
    aux.saleHour,
    COALESCE(COUNT(ets.saleID), 0) AS saleHourTotal
  FROM madeUpTable AS aux LEFT JOIN eventTicketSales AS ets
      ON aux.startTime <= ets.created AND ets.created < aux.endTime
GROUP BY aux.hourOrderID
ORDER BY hourOrderID

Оказывается, вы можете использовать Common Table Expressions (https://dev.mysql.com/doc/refman/8.0/en/with.html), чтобы сделать именно это:

WITH RECURSIVE aux AS
(
    SELECT 1 AS hourOrderId,
           HOUR(UTC_TIMESTAMP()) AS saleHour,
           DATE_ADD(
               DATE_FORMAT(UTC_TIMESTAMP(), "%Y-%m-%d %H:00:00"),
               INTERVAL 0 HOUR
           ) AS startDate,
           DATE_ADD(
               DATE_FORMAT(UTC_TIMESTAMP(), "%Y-%m-%d %H:00:00"),
               INTERVAL 1 HOUR
           ) AS endDate
    UNION ALL
    SELECT n + 1,
           HOUR(DATE_SUB(startDate, INTERVAL 1 HOUR)),
           DATE_SUB(startDate, INTERVAL 1 HOUR),
           DATE_SUB(startDate, INTERVAL 1 HOUR)
      FROM aux
     WHERE n < 25
)
SELECT
    aux.hourOrderID,
    aux.saleHour,
    COALESCE(COUNT(ets.saleID), 0) AS saleHourTotal
  FROM madeUpTable AS aux LEFT JOIN eventTicketSales AS ets
      ON aux.startTime <= ets.created AND ets.created < aux.endTime
GROUP BY aux.hourOrderID
ORDER BY hourOrderID

Лично я пытаюсь ограничить использование этой техники в коде, который затрагивает других людей, потому что это не то, что большинство людей видели в дикой природе, но для SQL, который только для меня, я считаю это более простым для чтения, потому что запрос само по себе просто. ИМХО, самая сложная часть этого - просто округлить текущее время до ближайшего часа, сохранив часть даты.

0 голосов
/ 12 января 2019

Я воспользовался советом @Strawberry в разделе комментариев и решил сделать этот уровень приложения, который теперь имеет большой смысл, так как его намного легче читать. Я не жалею, что попробовал версию SQL, как я немного узнал.

Я публикую нижеприведенное решение, которое написано на PHP для тех, кому нужно нечто подобное. Если у кого-то есть более эффективное решение, чем это, пожалуйста, поделитесь в комментариях.

Запрос:

SELECT
    CONCAT(DATE_FORMAT(created, '%Y-%m-%d %H'), ':00:00') AS saleHour,
    SUM(amount) AS totalSales
FROM eventTicketSales
WHERE created BETWEEN DATE_SUB(UTC_TIMESTAMP(), INTERVAL 24 HOUR) AND UTC_TIMESTAMP
GROUP BY HOUR(created);

Результат:

saleHour                 totalSales
2019-01-11 17:00:00      10000
2019-01-10 23:00:00      20000

Хранится в $salesIn24Hours

Логика:

$hours = 24 + 1;
for ($i=0; $i<$hours; $i++) {
    $date = date('Y-m-d H', strtotime('-'.$i.' HOUR')).':00:00';
    $key = array_search($date, array_column($salesIn24Hours, 'saleHour'));
    if ($key !== FALSE) {
        echo $date . ' ' . $salesIn24Hours[$key]['totalSales'] . '<br>';
    } else {
        echo $date . ' 0' . '<br>';
    }
}

Результат:

2019-01-11 21:00:00  0
2019-01-11 20:00:00  0
2019-01-11 19:00:00  0
2019-01-11 18:00:00  0
2019-01-11 17:00:00  10000
2019-01-11 16:00:00  0
2019-01-11 15:00:00  0
2019-01-11 14:00:00  0
2019-01-11 13:00:00  0
2019-01-11 12:00:00  0
2019-01-11 11:00:00  0
2019-01-11 10:00:00  0
2019-01-11 09:00:00  0
2019-01-11 08:00:00  0
2019-01-11 07:00:00  0
2019-01-11 06:00:00  0
2019-01-11 05:00:00  0
2019-01-11 04:00:00  0
2019-01-11 03:00:00  0
2019-01-11 02:00:00  0
2019-01-11 01:00:00  0
2019-01-11 00:00:00  0
2019-01-10 23:00:00  20000
2019-01-10 22:00:00  0
2019-01-10 21:00:00  0
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...