Поиск строк, которые имеют не четкую комбинацию столбцов - PullRequest
2 голосов
/ 11 марта 2019

В моей базе данных есть таблица, называемая транзакциями. Эта таблица в настоящее время содержит 542 046 записей для конкретного сайта, что на три больше, чем должно быть. При загрузке произошла ошибка, из-за которой первичного ключа на месте оказалось недостаточно.

Я собираюсь добавить новый ключ, основанный на по-прежнему и start_time, чтобы учесть это в будущих загрузках данных.

Однако, в отличие от удаления и повторной загрузки всех текущих данных, я пытаюсь найти 3 повторяющихся транзакции и удалить их.

Когда я запускаю этот запрос, я получаю 542 043 строки:

select count(*) from (
  select distinct start_time, till_id FROM 
    schema.transactions where site_id = "siteNo"
  )table2

То, что я хочу, это три транзакции_id, которые появляются в 542 046 строках, но не в 542 043 строках.

К сожалению, идентификаторы транзакций не совпадают для этих дублированных строк

1 Ответ

3 голосов
/ 11 марта 2019

Вы можете попробовать ниже -

select start_time, till_id,count(till_id) FROM 
    schema.transactions where site_id = "siteNo"
group by start_time, till_id
having count(till_id)>1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...