Мне повезло, что мне пришлось иметь дело с БД, которая содержит дубликаты определенных записей, я ищу быстрый способ сказать «получить наиболее заполненную запись и обновить дубликаты, чтобы соответствовать ей».
Оттуда я могу выбрать отдельные записи и получить полезный набор записей.
Есть идеи?
В основном это имена и адреса, если это помогает ...
Хорошо, здесь задано много вопросов, поэтому я добавлю немного больше:
Во-первых, я хочу выбрать наиболее «заполненные», а не наиболее «популярные», это означает строку с большинством значений, которые не равны нулю.
Когда у меня есть набор (что легко, потому что в моем случае совпадает идентификатор), я могу заполнить пропущенные значения в других строках.
Я не хочу уничтожать данные и собираюсь обновлять данные только на основе точного соответствия (например, по идентификатору).
Моя проблема на данный момент состоит в том, чтобы выяснить, какой из набора строк имеет наиболее заполненные поля, сказав, что с момента публикации этого вопроса я нашел другой способ решить мою большую проблему - отправить на удаленный сервер. однако мне все еще интересно узнать, каким может быть решение этой проблемы.
Пример данных может выглядеть примерно так ...
id name addr1 addr2 ect
1 fred 1 the street Some town ...
1 fred null null null
Учитывая таблицу, полную совпадающих пар, таких как эта, я хочу найти пары, затем взять одну с информацией в ней и вставить те значения, где в другой строке есть ноль.