Ну, вы все равно должны сделать резервную копию, на случай, если что-то пойдет не так.
С точки зрения контрольного журнала, я бы соблазнился таблицей дубликатов с дополнительным столбцом для того, когда он получил«слиться», то дом держать это.Скажите Чаку любую вещь, более чем X старая, из дубликатов перед запуском слияния.Другой вариант, который я видел, - это взвешивание того, насколько разные записи.«Точный дубликат» - это 0, все по-другому, но ключ - 100. Затем бросьте / продолжайте в зависимости от взвешивания.
Какой бы подход вы ни выбрали, посмотрите на него, исходя из того, что вы проверяете каждый анализ в начале изатем, когда «вы» почувствуете данные, вы можете молча их скопировать или посмотреть на расстановку приоритетов для критических слабостей в системе