Вы можете сгенерировать хеш для каждой строки (исключая PK), сохранить его в новом столбце (или, если вы не можете добавить новые столбцы, можете ли вы переместить таблицу во временную область подготовки?), А затем посмотреть для всех остальных строк с таким же хешем. Конечно, вы должны быть в состоянии гарантировать, что ваша хеш-функция не выдает одинаковый код для разных строк.
Если две строки повторяются, имеет ли значение, от чего вы избавляетесь? Возможно ли, что другие данные зависят от обоих дубликатов? Если это так, вам придется пройти несколько шагов:
- Найди дуплей
- Выберите один из них как
dupeA
, чтобы исключить
- Найти все данные, зависящие от
dupeA
- Измените эти данные, чтобы они ссылались на
dupeB
- удалить
dupeA
.
Это может быть легко или сложно, в зависимости от существующей модели данных.
Весь этот сценарий звучит как проект по техническому обслуживанию и перепроектированию. Если так, то удачи !!