Поиск дубликатов с несколькими критериями в Excel - PullRequest
1 голос
/ 21 февраля 2020

У меня есть список данных, в котором есть столбцы для разных пользователей, пути и временные метки запросов, в Excel.

Теперь задача такова: запрос считается дублирующим, если он создается одним и тем же пользователем. по тому же пути в течение 20 минут после другого запроса.

Я пробовал следующий код: =IF(COUNTIFS($A$2:$A$8,$A2,$B$2:$B$8,$B2)>1, "Duplicate row", "")

. При этом: столбец A предназначен для пользователей, столбец B - для путей, чтобы найти дубликаты записей для тех же пользователей, для тех же путей.

Тогда я застрял с факторами времени. Что делать дальше, ребята? Как получить окончательные дубликаты запросов?

Ответы [ 2 ]

1 голос
/ 21 февраля 2020

Вы можете использовать функцию SUMPRODUCT, если данные не отсортированы:

=SUMPRODUCT((A2=$A$2:$A$13)*(B2=$B$2:$B$13)*(C2-1/24/3<$C$2:$C$13)*(C2+1/24/3>$C$2:$C$13))>1

помечает все повторяющиеся строки как TRUE

или, если данные сортируются по Time поле по возрастанию :

=SUMPRODUCT((A2=$A$1:A1)*(B2=$B$1:B1)*(C2-1/24/3<$C$1:C1))>0

помечает все, но не первый дубликат, как ИСТИНА

enter image description here

0 голосов
/ 21 февраля 2020

Вы можете использовать следующий алгоритм

IF (разница шага по времени <20; IF (если true 1) шаблон = шаблон; (если true 2) «дублировать»; (если false 2 ) «Без дубликатов» (если ложно 1) «без дубликатов») </p>

...