MySQL "NOT IN" запрос - PullRequest
       31

MySQL "NOT IN" запрос

173 голосов
/ 05 октября 2009

Я хотел выполнить простой запрос, чтобы выбросить все строки Table1, где значение основного столбца отсутствует в столбце другой таблицы (Table2).

Я пытался использовать:

SELECT * FROM Table1 WHERE Table1.principal NOT IN Table2.principal

Вместо этого выдается синтаксическая ошибка. Поиск в Google привел меня на форумы, где люди говорили, что MySQL не поддерживает NOT IN, и нужно использовать что-то чрезвычайно сложное. Это правда? Или я совершаю ужасную ошибку?

Ответы [ 5 ]

298 голосов
/ 05 октября 2009

Чтобы использовать IN, у вас должен быть набор, используйте вместо этого следующий синтаксис:

SELECT * FROM Table1 WHERE Table1.principal NOT IN (SELECT principal FROM table2)
163 голосов
/ 05 октября 2009

Опция подзапроса уже получена, но обратите внимание, что во многих случаях LEFT JOIN может быть более быстрым способом сделать это:

SELECT table1.*
FROM table1 LEFT JOIN table2 ON table2.principal=table1.principal
WHERE table2.principal IS NULL

Если вы хотите проверить несколько таблиц, чтобы убедиться, что они отсутствуют ни в одной из таблиц (как в комментарии SRKR), вы можете использовать это:

SELECT table1.*
FROM table1
LEFT JOIN table2 ON table2.name=table1.name
LEFT JOIN table3 ON table3.name=table1.name
WHERE table2.name IS NULL AND table3.name IS NULL
36 голосов
/ 09 июля 2011

НЕ ВНУТРИ против НЕ СУЩЕСТВУЕТ против ЛЕВОГО СОЕДИНЕНИЯ / НУЛЬ В MySQL

MySQL, как и все другие системы, кроме SQL Server, может оптимизировать LEFT JOIN / IS NULL для возврата FALSE, как только будет найдено соответствующее значение, и это единственное система, которая заботилась о документировании этого поведения. [& hellip;] Поскольку MySQL не способен использовать алгоритмы объединения HASH и MERGE, единственное ANTI JOIN, на которое он способен, это NESTED LOOPS ANTI JOIN

[& hellip;] * 1 018 *

По сути, [NOT IN] точно такой же план, который использует LEFT JOIN / IS NULL, несмотря на то, что эти планы выполняются различными ветвями кода и они выглядят по-разному в результатах EXPLAIN. Алгоритмы фактически одинаковы, и запросы выполняются в одно и то же время.

[& hellip;] * * тысяча тридцать два

Трудно сказать точную причину [падение производительности при использовании NOT EXISTS] , поскольку это падение является линейным и, похоже, не зависит от распределения данных, количества значений в обеих таблицах и т. д., если оба поля проиндексированы. Поскольку в MySQL есть три фрагмента кода, которые по существу выполняют одну работу, возможно, код, ответственный за EXISTS, выполняет какую-то дополнительную проверку, которая требует дополнительного времени.

[& hellip;]

MySQL может оптимизировать все три метода, чтобы сделать что-то вроде NESTED LOOPS ANTI JOIN. [& Hellip;] Однако эти три метода генерируют три разных плана, которые выполняются тремя разными частями кода. Код, который выполняет предикат EXISTS, примерно на 30% менее эффективен [& hellip;]

Именно поэтому лучший способ поиска пропущенных значений в MySQL - это использование LEFT JOIN / IS NULL или NOT IN вместо NOT EXISTS.

(выделение добавлено)

7 голосов
/ 11 октября 2012

К сожалению, похоже, что проблема с использованием MySql предложения "NOT IN", на снимке экрана ниже показана опция подзапроса, возвращающая неверные результаты:

mysql> show variables like '%version%';
+-------------------------+------------------------------+
| Variable_name           | Value                        |
+-------------------------+------------------------------+
| innodb_version          | 1.1.8                        |
| protocol_version        | 10                           |
| slave_type_conversions  |                              |
| version                 | 5.5.21                       |
| version_comment         | MySQL Community Server (GPL) |
| version_compile_machine | x86_64                       |
| version_compile_os      | Linux                        |
+-------------------------+------------------------------+
7 rows in set (0.07 sec)

mysql> select count(*) from TABLE_A where TABLE_A.Pkey not in (select distinct TABLE_B.Fkey from TABLE_B );
+----------+
| count(*) |
+----------+
|        0 |
+----------+
1 row in set (0.07 sec)

mysql> select count(*) from TABLE_A left join TABLE_B on TABLE_A.Pkey = TABLE_B.Fkey where TABLE_B.Pkey is null;
+----------+
| count(*) |
+----------+
|      139 |
+----------+
1 row in set (0.06 sec)

mysql> select count(*) from TABLE_A where NOT EXISTS (select * FROM TABLE_B WHERE TABLE_B.Fkey = TABLE_A.Pkey );
+----------+
| count(*) |
+----------+
|      139 |
+----------+
1 row in set (0.06 sec)

mysql> 
5 голосов
/ 11 февраля 2015

Будьте осторожны NOT IN это не псевдоним для <> ANY, а для <> ALL!

http://dev.mysql.com/doc/refman/5.0/en/any-in-some-subqueries.html

SELECT c FROM t1 LEFT JOIN t2 USING (c) WHERE t2.c IS NULL

не может быть заменено на

SELECT c FROM t1 WHERE c NOT IN (SELECT c FROM t2)

Вы должны использовать

SELECT c FROM t1 WHERE c <> ANY (SELECT c FROM t2)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...