У меня есть таблица ниже
Таблица A:
row_number id start_dt end_dt cust_dt cust_id
1 101 4/8/19 4/20/19 4/10/19 725
2 101 4/21/19 5/20/19 4/10/19 456
3 101 5/1/19 6/30/19 4/10/19 725
4 101 7/1/19 8/20/19 4/10/19 725
Мне нужно подсчитать "дубликаты" в таблице для целей тестирования.
Критерии: необходимо исключить start_dt и end_dt из моего расчета. Это только дубликат, если строка lead
дублируется. Так, например, строка 1, строка 3 или 4 одинаковы, но только строки 3 и 4 будут считаться дубликатами в этом примере.
То, что я пробовал: rank
с lead
и самостоятельным соединением, но, похоже, это не работает для меня.
Как подсчитать идентификатор, чтобы определить, есть ли дубликаты?
Вывод: (что-то вроде ниже)
count id
2 101
Конечным результатом для меня является подсчет 1 для стола
count id
1 101