SQL-запрос для вызова нескольких столбцов с условиями (с NA) - PullRequest
0 голосов
/ 26 июня 2018

Это непрерывный вопрос из моего предыдущего вопроса . Я хочу написать запрос SQL для нескольких столбцов с условиями. Я работаю над R Studio, используя пакет RMySQL. Мой сервер MySQL.

Таблица выглядит следующим образом.

organisation          A           B           C           D
Ikea         2018-04-01  2018-05-07  2018-05-09  2018-05-01
Ikea         2018-06-01  2018-05-03  2018-05-29          NA   
Orange       2018-04-02  2018-05-01  2018-07-08  2018-05-26 
Ikea         2018-06-02  2018-05-01          NA  2018-05-26
Nestle       2018-06-02  2018-05-01          NA  2018-05-26
Ikea                 NA  2018-05-05  2018-04-02  2018-06-01

И я хочу получить строку, в которой организация является Ikea, и где самая ранняя дата среди четырех столбцов (A, B, C, D) находится между 2018-05-01 и 2018-05-31.

В строке, содержащей значения NA, я хочу игнорировать NA и посмотреть, какая самая ранняя дата среди остальных значений. Например, для второй строки самая ранняя дата - «2018-05-03» (столбец B), поэтому она соответствует критериям.

Таким образом, только вторая четвертая строка исходной таблицы выше соответствует условиям. И результат, который я хочу получить, должен быть:

organisation          A           B           C           D
Ikea         2018-06-01  2018-05-03  2018-05-29          NA    
Ikea         2018-06-02  2018-05-01          NA  2018-05-26

Как мне написать SQL-запрос? Вот моя попытка получить ответ на мой предыдущий вопрос, но он плохо работает для строк с NA.

SELECT * FROM myTable 
WHERE organisation LIKE Ikea
LEAST(A, B, C, D) >= '2018-05-01' AND
LEAST(A, B, C, D) < '2018-06-01'

Спасибо за любую помощь!

Ответы [ 3 ]

0 голосов
/ 26 июня 2018

Просто используйте coalesce():

SELECT *
FROM myTable 
WHERE organisation LIKE 'Ikea' AND
      LEAST(COALESCE(A, '2019-01-01'), COALESCE(B, '2019-01-01'), COALESCE(C, '2019-01-01'), COALESCE(D, '2019-01-01')) >= '2018-05-01' AND
      LEAST(COALESCE(A, '2019-01-01'), COALESCE(B, '2019-01-01'), COALESCE(C, '2019-01-01'), COALESCE(D, '2019-01-01')) < '2018-06-01';

'2019-01-01' - произвольная дата после диапазона.

0 голосов
/ 26 июня 2018

Рассмотрите возможность присоединения к агрегированному запросу, полученному с использованием UNION ALL:

SELECT m.*
FROM myTable m
INNER JOIN 
   (SELECT t.ID, MIN(t.`DateValue`) As MinDate
    FROM 
       (SELECT ID, organisation, 'A' As 'Category', A As `DateValue` FROM myTable
        UNION ALL
        SELECT ID, organisation, 'B' As 'Category', B As `DateValue` FROM myTable
        UNION ALL
        SELECT ID, organisation, 'C' As 'Category', C As `DateValue` FROM myTable
        UNION ALL
        SELECT ID, organisation, 'D' As 'Category', D As `DateValue` FROM myTable) As t
    WHERE t.organisation = 'Ikea'
    GROUP BY t.ID
    HAVING MIN(t.`DateValue`) >= '2018-05-01' AND MIN(t.`DateValue`) < '2018-06-01') As agg
ON m.ID = agg.ID;

RexTester Demo (Примечание: даты в формате ДД-ММ-ГГГГ)

SQL Query Results

0 голосов
/ 26 июня 2018

вы можете попробовать использовать IFNULL() для значений и использовать getdate(), поэтому, если бы оно было нулевым, его просто использовали бы сегодня, и тогда это не будет считаться наименьшим, который в основном игнорирует их.

нравится: LEAST(IFNULL(A,getdate()), IFNULL(B,getdate()), IFNULL(C,getdate()), IFNULL(D,getdate()))

надеюсь, это может подтолкнуть вас в правильном направлении

, если NA не является строкой, в которой вы можете использовать оператор case, например case when A = 'NA' THEN getdate() end

может выглядеть как

SELECT * FROM myTable 
WHERE organisation LIKE Ikea
LEAST(IFNULL(A,getdate()), IFNULL(B,getdate()), IFNULL(C,getdate()), IFNULL(D,getdate())) >= '2018-05-01' AND
LEAST(IFNULL(A,getdate()), IFNULL(B,getdate()), IFNULL(C,getdate()), IFNULL(D,getdate())) < '2018-06-01'

или

SELECT * FROM myTable 
WHERE organisation LIKE Ikea
LEAST(case when A = 'NA' THEN getdate() else A end, case when B = 'NA' THEN getdate() else B end, case when C = 'NA' THEN getdate() else C end, case when D = 'NA' THEN getdate() else D end) >= '2018-05-01' AND
LEAST(case when A = 'NA' THEN getdate() else A end, case when B = 'NA' THEN getdate() else B end, case when C = 'NA' THEN getdate() else C end, case when D = 'NA' THEN getdate() else D end) < '2018-06-01'
...