В моей базе данных есть таблица, называемая транзакциями. Эта таблица в настоящее время содержит 542 046 записей для конкретного сайта, что на три больше, чем должно быть. При загрузке произошла ошибка, из-за которой первичного ключа на месте оказалось недостаточно.
Я собираюсь добавить новый ключ, основанный на по-прежнему и start_time, чтобы учесть это в будущих загрузках данных.
Однако, в отличие от удаления и повторной загрузки всех текущих данных, я пытаюсь найти 3 повторяющихся транзакции и удалить их.
Когда я запускаю этот запрос, я получаю 542 043 строки:
select count(*) from (
select distinct start_time, till_id FROM
schema.transactions where site_id = "siteNo"
)table2
То, что я хочу, это три транзакции_id, которые появляются в 542 046 строках, но не в 542 043 строках.
К сожалению, идентификаторы транзакций не совпадают для этих дублированных строк