Моя цель состоит в том, чтобы идентифицировать дубликаты записей на основе одинаковых значений в столбцах.
update table1
set reason = 'duplicate'
where id exists in (select min(id)
from table 1
where company ='Bestbuy'
and account = '123456'
group by company, account, date, price, member_id, amount)
and company = 'Bestbuy'
and account = '123456'
Таким образом, все группы дубликатов будут сгруппированы вместе, и в столбце «причина» будет указано, что это дубликат. Сейчас я пытаюсь разрешить ситуацию, когда я могу сгруппировать по всем этим столбцам, но я хочу «исключать» записи только в том случае, если, скажем, «торговый представитель» отличается.
Итак, в этом примере таблицы:

Так, например, 1-й, 4-й, 5-й, 9-й и 10-й будут сгруппированы по компаниям, счетам, дате, цене и member_ID. Торговый представитель изменился бы, все же. Я пытаюсь создать подгруппу, которая, как мне кажется, основана на первой группе, которая обновит записи в группе с разными торговыми представителями.
Таким образом, в конце 10-я запись будет исключена.