У меня есть таблица с записями 60 КБ, мне нужно найти записи, которые являются дубликатами, основанными на столбце Crime ID
, так что я выяснил это:
SELECT * FROM crimedata GROUP BY `Crime ID` HAVING COUNT(`Crime ID`) > 1
Этот запрос возвращает, сколько раз встречался конкретный Crime ID
. Поскольку большая часть Crime ID
появлялась дважды, это работало, но у меня также есть 10 тыс. Записей, где Crime ID
пусто (не ноль), и этот запрос не может это различить. Мне нужен запрос, который будет возвращать каждый Crime ID
, который является дубликатом и оставит один как первый уникальный.
Crime ID | column2 | column3 |
------------------------------
abc a b 1
abc a a 2
a b b 3
b b b 4
a a a 5
b a a 6
abc b a 7
Из этого примера запрос вернет 2, 5, 6, 7 записи.