У меня есть несколько тысяч записей с несколькими 100 полями в таблице MySQL.
Некоторые записи являются дубликатами и помечены как таковые. Теперь, когда я могу просто удалить дубликаты, я хочу сохранить любые другие возможные ценные ненулевые данные, которых нет в исходной версии записи. Надеюсь, я понял.
Например:
a b c d e f key dupe
--------------------
1 d c f k l 1 x
2 g h j 1
3 i h u u 2
4 u r t 2 x
Из приведенной выше таблицы примеров, желаемый результат:
a b c d e f key dupe
--------------------
2 g c h k j 1
3 i r h u u 2
Если вы внимательно посмотрите, дубликат определяется с помощью ключа (он одинаков для 2 записей, поэтому тот, который имеет «x» для поля дублирования, удаляется при сохранении некоторых поля из дубли (например, значения c, e для ключа 1).
Пожалуйста, дайте мне знать, если вам нужна дополнительная информация об этой загадочной проблеме.
Спасибо за тонну!
p.s: Если невозможно использовать MySQL, пример сценария PERL / Python будет потрясающим! Спасибо!