Почему EXCEPT существует в T-SQL? - PullRequest
24 голосов
/ 02 февраля 2012

Я только что прочитал о EXCEPT и INTERSECT в библиотеке MSDN и наткнулся на этот пример использования INTERSECT:

USE AdventureWorks2008R2 GO 
SELECT ProductID 
FROM Production.Product
INTERSECT
SELECT ProductID 
FROM Production.WorkOrder ;
--Result: 238 Rows (products that have work orders)

Возможно, я старомоден, но для достижения того же результата обычно использую следующий код:

SELECT P.ProductID 
FROM Production.Product P 
INNER JOIN Production.WorkOrder W ON W.ProductID = P.ProductID

Я что-то упустил или INTERSECT такой же, как INNER JOIN? Есть ли преимущество в производительности при использовании одного над другим?

Тот же вопрос, КРОМЕ. Как это:

USE AdventureWorks2008R2;
GO
SELECT ProductID 
FROM Production.Product
EXCEPT
SELECT ProductID 
FROM Production.WorkOrder ;
--Result: 266 Rows (products without work orders)

отличается от этого:

SELECT P.ProductID 
FROM Production.Product P 
LEFT JOIN Production.WorkOrder W ON W.ProductID = P.ProductID
WHERE W.ProductID IS NULL

Ответы [ 4 ]

25 голосов
/ 02 февраля 2012

Я собираюсь сосредоточиться на EXCEPT только потому, что я более знаком с этим. Кроме того, в качестве отказа от ответственности, мои примеры будут в Sqlite, так как я на Linux box. Однако и Sqlite, и SQL Server должны поддерживать эту функциональность.

И INTERSECT, и EXCEPT являются операторами множеств, вытекающими из основополагающих идей реляционной алгебры . Они работают с отличными значениями , будучи заданными операторами.

Ваш пример упрощен. Я приведу контрпример, используя версию Sqlite Northwind образца базы данных.

Допустим, вы хотите получить CustomerID всех клиентов, которые сделали заказ с EmployeeID, равным 5, но НЕ тех, кто также сделал заказ с EmployeeID, равным 6. Это просто и естественно с EXCEPT.

SELECT CustomerID FROM orders
WHERE EmployeeID = 5
EXCEPT
SELECT CustomerID FROM orders
WHERE EmployeeID = 6

Это возвращает 14 строк в моей версии Northwind.

Предположим, вы решили переписать это, используя JOIN s. Может быть, что-то вроде этого?

SELECT o1.CustomerID
FROM orders o1 INNER JOIN orders o2 ON o1.CustomerID = o2.CustomerID
WHERE o1.EmployeeID = 5 AND o2.EmployeeID != 6

Упс, 525 строк. Может быть, добавить DISTINCT?

SELECT DISTINCT o1.CustomerID
FROM orders o1 INNER JOIN orders o2 ON o1.CustomerID = o2.CustomerID
WHERE o1.EmployeeID = 5 AND o2.EmployeeID != 6

Теперь это 28 рядов, все еще намного больше, чем мы получили с EXCEPT. Причина в том, что это не удаляет CustomerID, которые сделали заказ с 6. Скорее, он возвращает все CustomerID, которые имеют заказ с 5 и некоторые EmployeeID, отличные от 6 или нет у них также есть заказ с EmployeeID 6.

Короче говоря, EXCEPT и INTERSECT - операторы множеств, которые сравнивают два запроса, возвращая уникальные кортежи, и, безусловно, их используют.

22 голосов
/ 02 февраля 2012
  • INTERSECT и EXCEPT являются полусоединениями
  • JOIN является равносоединением

Поэтому при объединении 2 таблиц, которые соответствуют, скажем, 5 строкам и 3 строкам

  • JOIN дает 15 строк
  • INTERSECT дает 3 строки

EXCEPT аналогичен OUTER JOIN по той же причине

Пока мы 'о полусоединениях, то в основном

  • INTERSECT дает те же результаты, что и EXISTS
  • EXCEPT дает те же результаты, что и NOT EXISTS

«В основном» происходит потому, что и INTERSECT, и EXCEPT

Edit, Quick demo всего этого

DECLARE @t1 TABLE (t1col INT);
INSERT @t1 VALUES (1), (2), (2), (3), (3), (5), (5);

DECLARE @t2 TABLE (t2col INT);
INSERT @t2 VALUES (1), (2), (3), (4);

SELECT 'INNER JOIN', * FROM @t1 t1 JOIN @t2 t2 ON t1.t1col = t2.t2col -- same both ways

SELECT 't1 INTERSECT t2', * FROM @t1 INTERSECT SELECT 't1 INTERSECT t2', * FROM @t2;

SELECT 't2 INTERSECT t1', * FROM @t2 INTERSECT SELECT 't2 INTERSECT t1', * FROM @t1;

SELECT 't1 EXISTS t2', * FROM @t1 t1
WHERE EXISTS (SELECT * FROM @t2 t2 WHERE t1.t1col = t2.t2col);

SELECT 't2 EXISTS t1', * FROM @t2 t2
WHERE EXISTS (SELECT * FROM @t1 t1 WHERE t1.t1col = t2.t2col);

SELECT 't1 LEFT JOIN t2, IS NULL', * FROM @t1 t1 LEFT JOIN @t2 t2 ON t1.t1col = t2.t2col WHERE t2.t2col IS NULL
SELECT 't2 LEFT JOIN t1, IS NULL', * FROM @t2 t2 LEFT JOIN @t1 t1 ON t1.t1col = t2.t2col WHERE t1.t1col IS NULL

SELECT 't1 EXCEPT t2', * FROM @t1 EXCEPT SELECT 't1 EXCEPT t2', * FROM @t2;

SELECT 't2 EXCEPT t1', * FROM @t2 EXCEPT SELECT 't2 EXCEPT t1', * FROM @t1;

SELECT 't1 NOT EXISTS t2', * FROM @t1 t1
WHERE NOT EXISTS (SELECT * FROM @t2 t2 WHERE t1.t1col = t2.t2col);

SELECT 't2 NOT EXISTS t1', * FROM @t2 t2
WHERE NOT EXISTS (SELECT * FROM @t1 t1 WHERE t1.t1col = t2.t2col);

Обновление: февраль 2013. Добавлен дополнительный столбец для описания операции

1 голос
/ 02 февраля 2012

Ваши примеры ваших "эквивалентных" запросов неверны - запрос с INTERSECT не всегда возвращает тот же результат, что и INNER JOIN и тот же для EXCEPT и LEFT JOIN.

Посмотрите на конкретный пример с INTERSECT:

DECLARE @t TABLE(t INT NOT NULL)
DECLARE @x TABLE(x INT NOT NULL)

INSERT @t
VALUES (1), (2), (3)

INSERT @x VALUES(1), (1), (1)

SELECT t FROM @t
INTERSECT SELECT x FROM @x

SELECT t FROM @t
INNER JOIN @x ON x = t

INTERSECT больше похоже на (, но не совпадает с ) как IN предложение:

SELECT t FROM @t
WHERE t IN (select x FROM @x)

или как EXISTS

SELECT t FROM @t
WHERE EXISTS (select * FROM @x WHERE x = t)

Те же примеры, которые вы можете адаптировать к предложению EXCEPT.

0 голосов
/ 02 февраля 2012

По моему мнению EXCEPT и INTERSECT используются для выполнения тех же действий, что и команда JOIN, но это проще для таблиц, которые не имеют первичных ключей, например:

с INTERSECT:

SELECT FIRSTNAME,
       LASTNAME,
       ADDRESSLINE1,
       CITY,
       STATEPROVINCECODE,
       POSTALCODE
FROM   MANAGER 
EXCEPT
SELECT FIRSTNAME,
       LASTNAME,
       ADDRESSLINE1,
       CITY,
       STATEPROVINCECODE,
       POSTALCODE
FROM   CUSTOMER

И чтобы получить тот же результат с JOIN, вы должны сделать:

SELECT   M.FIRSTNAME,
         M.LASTNAME,
         M.ADDRESSLINE1,
         M.CITY,
         M.STATEPROVINCECODE,
         M.POSTALCODE
FROM     MANAGER M
WHERE    NOT EXISTS (SELECT *
                     FROM   CUSTOMER C
                     WHERE  M.FIRSTNAME = C.FIRSTNAME
                            AND M.LASTNAME = C.LASTNAME
                            AND M.ADDRESSLINE1 = C.ADDRESSLINE1
                            AND M.CITY = C.CITY
                            AND M.POSTALCODE = C.POSTALCODE)
GROUP BY M.FIRSTNAME,M.LASTNAME,M.ADDRESSLINE1,M.CITY,
         M.STATEPROVINCECODE,M.POSTALCODE 

Подробнее здесь .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...