Я написал запрос следующим образом:
SELECT COUNT(*) AS count, email
FROM sometable
GROUP BY email
ORDER BY count DESC
LIMIT 4
Мне интересно увидеть четыре наиболее повторяющиеся записи электронной почты в таблице.Пока что кажется, что он возвращает именно то, что я хочу:
count email
12 very-duplicated@email.com
2 duped-twice@email.com
2 also-twice@email.com
1 single@email.com
Когда я не использую LIMIT
, я получаю тот же результат (хотя и с большим количеством строк, имеющих число = 1).Что мне интересно, так это LIMIT
.В будущем, когда цифры изменятся, мой запрос по-прежнему будет возвращать четыре наиболее часто используемых письма?или запрос должен сканировать всю базу данных, чтобы оставаться точным?
(примечание: я не пытаюсь предотвратить дубликаты, я пытаюсь увидеть наиболее часто используемую электронную почту.)