Есть ли у вас индекс для ускорения запросов?
Чтобы найти дублоны, вы можете использовать группу следующим образом:
SELECT COUNT(*) AS nbr_doublon, champ1, champ2, champ3
FROM table
GROUP BY champ1, champ2, champ3
HAVING COUNT(*) > 1
Если вы хотите сделать это для подмножества:
SELECT COUNT(*) AS nbr_doublon, champ1, champ2, champ3
FROM (SELECT * from table limit 100000)
GROUP BY champ1, champ2, champ3
HAVING COUNT(*) > 1