Как удалить полностью повторяющиеся строки - PullRequest
7 голосов
/ 27 июля 2010

Скажем, у меня есть дублирующиеся строки в моей таблице, и моя база данных 3-го класса: -

Insert Into tblProduct (ProductId,ProductName,Description,Category) Values (1,'Cinthol','cosmetic soap','soap');
Insert Into tblProduct (ProductId,ProductName,Description,Category) Values (1,'Cinthol','cosmetic soap','soap');
Insert Into tblProduct (ProductId,ProductName,Description,Category) Values (1,'Cinthol','cosmetic soap','soap');
Insert Into tblProduct (ProductId,ProductName,Description,Category) Values (1,'Lux','cosmetic soap','soap');
Insert Into tblProduct (ProductId,ProductName,Description,Category) Values (1,'Crowning Glory','cosmetic soap','soap');
Insert Into tblProduct (ProductId,ProductName,Description,Category) Values (2,'Cinthol','nice soap','soap');
Insert Into tblProduct (ProductId,ProductName,Description,Category) Values (3,'Lux','nice soap','soap');
Insert Into tblProduct (ProductId,ProductName,Description,Category) Values (3,'Lux','nice soap','soap');

Я хочу, чтобы в моей таблице присутствовал только 1 экземпляр каждой строки. Таким образом, 2nd, 3rd and last row, которые полностью идентичны, должны быть удалены. Какой запрос я могу написать для этого? Можно ли это сделать без создания временных таблиц? Просто в одном запросе?

Заранее спасибо:)

Ответы [ 4 ]

18 голосов
/ 27 июля 2010

Попробуйте - это удалит все дубликаты из вашей таблицы:

;WITH duplicates AS
(
    SELECT 
       ProductID, ProductName, Description, Category,
       ROW_NUMBER() OVER (PARTITION BY ProductID, ProductName
                          ORDER BY ProductID) 'RowNum'
    FROM dbo.tblProduct
)
DELETE FROM duplicates
WHERE RowNum > 1
GO

SELECT * FROM dbo.tblProduct
GO

Ваши дубликаты должны быть удалены: вывод:

ProductID   ProductName   DESCRIPTION        Category
   1          Cinthol         cosmetic soap      soap
   1          Lux             cosmetic soap      soap
   1          Crowning Glory  cosmetic soap      soap
   2          Cinthol         nice soap          soap
   3          Lux             nice soap          soap
4 голосов
/ 27 июля 2010
DELETE tblProduct 
FROM tblProduct 
LEFT OUTER JOIN (
   SELECT MIN(ProductId) as ProductId, ProductName, Description, Category
   FROM tblProduct 
   GROUP BY ProductName, Description, Category
) as KeepRows ON
   tblProduct.ProductId= KeepRows.ProductId
WHERE
   KeepRows.ProductId IS NULL

Украдено из Как удалить повторяющиеся строки?

ОБНОВЛЕНИЕ:

Это будет работать, только если ProductId является основнымКлюч (которого это не так).Вам лучше использовать метод @marc_s, но я оставлю это на всякий случай, если кто-то, использующий ПК, столкнется с этим сообщением.

1 голос
/ 27 июля 2010

Мне пришлось сделать это несколько недель назад ... какую версию SQL Server вы используете? В SQL Server 2005 и более поздних версиях вы можете использовать Row_Number как часть вашего выбора и выбирать только, где Row_Number равен 1. Я забыл точный синтаксис, но он хорошо задокументирован ... что-то вроде:

Select t0.ProductID, 
       t0.ProductName, 
       t0.Description, 
       t0.Category
Into   tblCleanData
From   (
    Select ProductID, 
           ProductName, 
           Description, 
           Category, 
           Row_Number() Over (
               Partition By ProductID, 
                            ProductName, 
                            Description, 
                            Category
               Order By     ProductID,
                            ProductName,
                            Description,
                            Category
           ) As RowNumber
    From   MyTable
) As t0
Where t0.RowNumber = 1

Проверьте http://msdn.microsoft.com/en-us/library/ms186734.aspx,, что должно привести вас в правильном направлении.

0 голосов
/ 27 июля 2010

Первое использование SELECT... INTO:

SELECT DISTINCT ProductID, ProductName, Description, Category
    INTO tblProductClean
    FROM tblProduct

Сброс первой таблицы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...