Установка логического значения в качестве записи mysql указывает, существует ли другая запись до выбранного диапазона timeStamp - PullRequest
0 голосов
/ 14 января 2019

Базовая таблица похожа на:

mysqlTable:
          visitorID   ,park          ,DateTimeStamp
          8369        ,Birmingham    ,12/27/2018 03:26:38 PM
          8369        ,Birmingham    ,12/28/2018 11:27:32 AM
          8828        ,Central       ,01/02/2019 10:01
          8828        ,Central       ,01/04/2019 9:50
          8825        ,Central       ,12/21/2018 09:47:27 AM
          8821        ,Central       ,12/26/2018 10:11:40 AM
          8821        ,Central       ,02/03/2019 10:00:59 AM
          8821        ,Central       ,01/02/2019 10:04
          88281       ,Central       ,01/04/2019 9:53

Из этой таблицы я создаю новую таблицу, в которой я рассчитываю идентификатор посетителя в определенном парке, а затем группирую посещения по идентификатору посетителя и дате посещения за определенный период времени.

mysql query: 

SELECT COUNT(*)AS visits,dateTimeStamp,visitorID 
FROM parkVisits 
WHERE 
    dateTimeStamp BETWEEN '2019-01-01 00:00:01' AND '2019-01-04 23:59:59'
    AND park ='Central'
GROUP BY visitorID, CAST(dateTimeStamp AS DATE);

мой результат:

mysql table:

visits   ,dateTimeStamp     ,visitorID   
2        ,01/02/2019 10:01  ,8828      
1        ,01/02/2019 10:04  ,8821       
1        ,01/04/2019 9:53   ,88281      

Я хотел бы иметь столбец, в котором логическое значение указывает, посетил ли посетитель в любое время до указанной даты его строки. Я думал о сравнении самого раннего dateTimeStamp в таблице с самой ранней из указанных дат, но может возникнуть ситуация, когда первый визит и повторный визит произошли в течение данного периода.

ожидается

mysql table:

visits   ,dateTimeStamp   ,visitorID    ,returningVisitor
2        ,01/02/2019 10:01,  8828       ,TRUE
1        ,01/02/2019 10:04,  8821       ,FALSE
1        ,01/04/2019 9:53,   88281      ,FALSE

EDIT:

Я использую MySQL 5.6.40

1 Ответ

0 голосов
/ 15 января 2019

Предполагая, что вы работаете с MySQL 8.0, вы можете использовать внутренний запрос с оконной функцией FIRST_VALUE, чтобы выбрать временную метку первого посещения в период анализа. Затем во внешнем запросе можно использовать предложение EXISTS с подзапросом, чтобы проверить, бывал ли текущий посетитель когда-либо ранее в том же парке.

SELECT 
    x.visits,
    x.dateTimeStamp,
    x.visitorID,
    EXISTS (
        SELECT 1 FROM parkVisits WHERE park = x.park AND visitorID = x.visitorID AND dateTimeStamp < x.dateTimeStamp
    ) returningVisitor
FROM (
    SELECT DISTINCT
        COUNT(*) OVER (PARTITION BY p.visitorID) visits,
        FIRST_VALUE(p.dateTimeStamp) OVER (PARTITION BY p.visitorID ORDER BY p.dateTimeStamp) dateTimeStamp,
        p.visitorID,
        p.park
    FROM parkVisits p
    WHERE
        p.dateTimeStamp BETWEEN '2019-01-01 00:00:01' AND '2019-01-04 23:59:59' 
        AND p.park ='Central'
) x
ORDER BY 1 desc, 2

В это дБ скрипка с вашими данными выборки возвращает:

| visits | dateTimeStamp       | visitorID | returningVisitor |
| ------ | ------------------- | --------- | ---------------- |
| 2      | 2019-01-02 10:01:00 | 8828      | 0                |
| 1      | 2019-01-02 10:04:00 | 8821      | 1                |
| 1      | 2019-01-04 09:53:00 | 88281     | 0                |

NB. Я думаю, что возвращающийся посетитель - 8821, а не 8828, как показано в вашем вопросе.

Если вы используете более раннюю версию MySQL, которая не поддерживает оконные функции, вы можете использовать в подзапросе предложение GROUP BY, например:

SELECT 
    x.visits,
    x.dateTimeStamp,
    x.visitorID,
    EXISTS (
        SELECT 1 FROM parkVisits WHERE park = x.park AND visitorID = x.visitorID AND dateTimeStamp < x.dateTimeStamp
    ) returningVisitor
FROM (
    SELECT DISTINCT
        COUNT(*) visits,
        MIN(p.dateTimeStamp) dateTimeStamp,
        p.visitorID,
        p.park
    FROM parkVisits p
    WHERE
        p.dateTimeStamp BETWEEN '2019-01-01 00:00:01' AND '2019-01-04 23:59:59' 
        AND p.park ='Central'
    GROUP BY p.visitorID, p.park
) x
ORDER BY 1 desc, 2   

См. Эта дБ скрипка .

...