Учитывая, что вы используете SQL 2008, у вас есть два варианта, чтобы легко решить проблему без необходимости значительного изменения приложения (если вообще).
Первое возможное решение - создать вторую таблицу, подобную первой, но с добавленным суррогатным ключом идентификации и ограничением уникальности, используя опцию ignore_dup_key, которая сделает всю тяжелую работу по устранению дубликатов за вас.
Вот пример, который вы можете запустить в SSMS, чтобы увидеть, что происходит:
if object_id( 'tempdb..#test1' ) is not null drop table #test1;
if object_id( 'tempdb..#test2' ) is not null drop table #test2;
-- example heap table with duplicate record
create table #test1
col1 int
,col2 varchar(50)
,col3 char(3)
insert #test1( col1, col2, col3 )
( 250, 'Joe''s IT Consulting and Bait Shop', null )
,( 120, 'Mary''s Dry Cleaning and Taxidermy', 'ACK' )
,( 250, 'Joe''s IT Consulting and Bait Shop', null ) -- dup record
,( 666, 'The Honest Politician', 'LIE' )
,( 100, 'My Invisible Friend', 'WHO' )
-- secondary table for removing duplicates
create table #test2
sk int not null identity primary key
,col1 int
,col2 varchar(50)
,col3 char(3)
-- add a uniqueness constraint to filter dups
,constraint UQ_test2 unique ( col1, col2, col3 ) with ( ignore_dup_key = on )
-- insert all records from original table
-- this should generate a warning if duplicate records were ignored
insert #test2( col1, col2, col3 )
select col1, col2, col3
from #test1;
Кроме того, вы также можете удалить дубликаты на месте без второй таблицы, но производительность может быть слишком низкой для ваших нужд. Вот код для этого примера, также запускаемый в SSMS:
if object_id( 'tempdb..#test1' ) is not null drop table #test1;
-- example heap table with duplicate record
create table #test1
col1 int
,col2 varchar(50)
,col3 char(3)
insert #test1( col1, col2, col3 )
( 250, 'Joe''s IT Consulting and Bait Shop', null )
,( 120, 'Mary''s Dry Cleaning and Taxidermy', 'ACK' )
,( 250, 'Joe''s IT Consulting and Bait Shop', null ) -- dup record
,( 666, 'The Honest Politician', 'LIE' )
,( 100, 'My Invisible Friend', 'WHO' )
-- add temporary PK and index
alter table #test1 add sk int not null identity constraint PK_test1 primary key clustered;
create index IX_test1 on #test1( col1, col2, col3 );
-- note: rebuilding the indexes may or may not provide a performance benefit
alter index PK_test1 on #test1 rebuild;
alter index IX_test1 on #test1 rebuild;
-- remove duplicates
with ranks as
,ordinal = row_number() over
-- put all the columns composing uniqueness into the partition
partition by col1, col2, col3
order by sk
from #test1
from ranks
where ordinal > 1;
-- remove added columns
drop index IX_test1 on #test1;
alter table #test1 drop constraint PK_test1;
alter table #test1 drop column sk;