Найти дубликаты в подгруппах с условиями - PullRequest
0 голосов
/ 04 июня 2018

У меня проблемы с подсчетом случаев, когда определенное значение появляется в подгруппе группы.

Ниже приведены примеры данных:

GROUP   ID  DATA  
1       1   Main St    
1       1   1st St
1       2   Main St
1       2   
2       1   Main St
2       1   Main St
2       1   
2       2   1st St
2       2   

Контекст: я разрешаю дубликаты в моих данных, есть случаи, когда один и тот же человек имеет два отдельных идентификатора и записи.Я запустил автоматическую проверку для идентификации возможных дубликатов, которые помечены полем GROUP;поле идентификатора - это отдельные идентификационные номера.Информация об адресе - это очень простой способ выбрать дубликаты.

Мне нужно написать что-то, что делает следующее:

Для каждого номера группы просмотрите все уникальные идентификаторы внутри.Для каждого уникального идентификатора в группе посмотрите, отображается ли адрес в поле DATA для любого другого уникального идентификатора в группе, но не для номера идентификатора в этой конкретной строке.Любые совпадения должны быть помечены как 1 / ИСТИНА / и т. Д.

Я написал формулу COUNTIFS, которая проходит большую часть пути, но не исключает строку формулы.

ЭтоCOUNTIFS (A: A, A2, B: B, "<> &", C: C, C2)

Для первой строки должно быть получено 1, b / c Main St появляется в Group1ID1, а также в Group1 ID2.Я не могу заставить его игнорировать строку Group1 ID1, я застрял с формулой, дающей мне 2 для результата, b / c Main Street дважды появляется в Group1.

Любая помощь приветствуется.

Спасибо!

1 Ответ

0 голосов
/ 04 июня 2018

Используйте эту формулу COUNTIFS в ячейке D2 и скопируйте:

=COUNTIFS(A$2:A2,A2,C$2:C2,C2)>1

Соответствующие дубликаты будут помечены TRUE

...