Я мало что знаю об этом c, но нечеткое сопоставление в Power Query с порогом 0.50
с последующим удалением дубликатов, похоже, работает для вашего примера данных. Может потребоваться некоторая настройка ваших реальных данных.
Сделайте два столбца двумя разными таблицами
Data / Get & Преобразовать / Из таблицы / Диапазон для каждой таблицы
Затем в пользовательском интерфейсе PQ выберите Merge Queries
- Я выбрал Left OuterJoin
- Использовать нечеткое соответствие
- Порог 0,5
Выберите первый столбец и Remove Duplicates
Все вышеперечисленных шагов можно выполнить из пользовательского интерфейса Power Query
Результаты
введите описание изображения здесь
Вы также можете сделать это, преобразовав два столбца в одну таблицу и введя приведенный ниже код в расширенный редактор:
Код разделяет таблицу на две таблицы, а затем использует метод FuzzyJoin / Remove Duplicates для их объединения.
let
Source = Excel.CurrentWorkbook(){[Name="Table10"]}[Content],
tbl1 = Table.FromList(Source[Column1], Splitter.SplitByNothing(), null, null, ExtraValues.Error),
#"Changed Type1" = Table.TransformColumnTypes(tbl1,{{"Column1", type text}}),
tbl2 = Table.FromList(Source[Column2], Splitter.SplitByNothing(), null, null, ExtraValues.Error),
#"Changed Type" = Table.TransformColumnTypes(tbl2,{{"Column1", type text}}),
tbl3 = Table.FuzzyNestedJoin(#"Changed Type1","Column1",#"Changed Type","Column1","Matched",JoinKind.LeftOuter,
[IgnoreCase = true, IgnoreSpace= false, Threshold = 0.5]),
#"Expanded Matched" = Table.ExpandTableColumn(tbl3, "Matched", {"Column1"}, {"Matched"}),
#"Removed Duplicates" = Table.Distinct(#"Expanded Matched", {"Column1"})
in
#"Removed Duplicates"