Поиск дубликатов записей в Power Query - PullRequest
1 голос
/ 20 апреля 2020

Я пытаюсь найти дубликаты записей в Power Query. Мне не нужно их удалять, мне просто нужно их идентифицировать. Я выставляю образец здесь.

enter image description here

Как видно на рисунке ниже, первая запись на самом деле не является дубликатом в отличие от строки ниже. Я довольно новичок в использовании мощных запросов, и все, что я сделал здесь, это то, что я обычно делал в EXCEL: enter image description here

Мне было интересно, может ли кто-нибудь сказать мне, что я могу делать здесь не так. Спасибо

1 Ответ

2 голосов
/ 20 апреля 2020

Что вы хотите сделать, это щелкнуть правой кнопкой мыши по столбцу идентификатора, сгруппировать по ...

Нажмите [Дополнительно]

По умолчанию в первой строке внизу должно быть указано количество строк

[Добавить объединение] с новым именем столбца «Все» и операцией «Все строки»

enter image description here

Хит [OK]

Нажмите на стрелки в верхней части столбца Все и [x] столбец идентификатора и любые другие столбцы, которые могли быть там, здесь предполагается, что они называются Другие

enter image description here enter image description here

Столбец подсчета будет> 1 для двойных строк.

Затем вы можете удалить дополнительные столбцы и отфильтровать, если хотите

Или добавить Пользовательский столбец с формулой

=if [Count]>1 then "Dupe" else "Single"

enter image description here

let Source = Excel.CurrentWorkbook(){[Name="Table1"]}[Content],
#"Grouped Rows" = Table.Group(Source, {"ID"}, {{"Count", each Table.RowCount(_), type number}, {"All", each _, type table}}),
#"Expanded All" = Table.ExpandTableColumn(#"Grouped Rows", "All", {"ID", "Other"}, {"ID.1", "Other"})
in #"Expanded All"
...