Question

Есть ли способ улучшить производительность SQL-запросов такого типа:

INSERT
INTO ...
WHERE NOT EXISTS(Validation...)

Проблема в том, что когда в моей таблице много данных (например, миллионов строк), выполнение предложения WHERE NOT EXISTS выполняется очень медленно. Я должен сделать эту проверку, потому что я не могу вставить дублированные данные.

Я использую SQLServer 2005

ТНХ

Blorgbeard · Answer 1 · 16 февраля 2009

Вне моей головы, вы можете попробовать что-то вроде:

 TRUNCATE temptable
 INSERT INTO temptable ...
 INSERT INTO temptable ... 
 ...
 INSERT INTO realtable
 SELECT temptable.* FROM temptable
 LEFT JOIN realtable on realtable.key = temptable.key
 WHERE realtable.key is null

cjk · Answer 2 · 16 февраля 2009

Убедитесь, что вы выполняете поиск по индексированным столбцам, без манипуляций с данными в этих столбцах (например, подстрокой и т. Д.)

Otávio Décio · Answer 3 · 16 февраля 2009

Попробуйте заменить NOT EXISTS на левое внешнее соединение, иногда оно работает лучше в больших наборах данных.

SqlACID · Answer 4 · 17 февраля 2009

insert into customers 
select * 
from newcustomers 
where customerid not in (select customerid 
                         from customers)

.. может быть более эффективным. Как уже говорили другие, убедитесь, что у вас есть индексы для любых полей поиска.

hova · Answer 5 · 16 февраля 2009

Если вы вообще сможете уменьшить свое проблемное пространство, то вы получите кучу производительности. Вы абсолютно уверены, что каждая из этих строк в этой таблице должна быть проверена?

Другая вещь, которую вы можете попробовать - это DELETE InsertTable FROM InsertTable INNER JOIN ExistingTable ON <Validation criteria> перед вашей вставкой. Тем не менее, ваш пробег может варьироваться

dwc · Answer 6 · 16 февраля 2009

Обратите внимание на другой ответ относительно индексации. NOT EXISTS обычно довольно быстрый, если у вас хорошие индексы.

Но у меня были проблемы с производительностью с утверждениями, которые вы описываете. Один из методов, который я использовал для обхода, состоит в том, чтобы использовать временную таблицу для значений-кандидатов, выполнить DELETE FROM ... WHERE EXISTS (...), а затем вслепую вставить остаток. Внутри сделки, конечно же, чтобы избежать условий гонки. Разделение запросов иногда позволяет оптимизатору выполнять свою работу, не путаясь.

SQL - улучшить производительность запросов NOT EXISTS

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

SQL - улучшить производительность запросов NOT EXISTS

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 6 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы