Мне выданы 2 кадра данных с географической структурой:
Кадр данных 1: -
province municipality barangay
camarines sur magarao city brgy bell
camarines sur magarao city brgy. bell
camarines sur magarao bell
isabel cauayan city district 2
isabela cauayan city andarayan
isabela cauayan city baringin sur
isabela cauayan city buyon
isabela cauayan city cabaruan
isabela cauayan city cabugao
isabela cauayan city pinoma
Кадр данных2: -
province municipality
camarines sur magarao
isabela city of cauayan
Цель: - Извлечь все уникальные значения барангая на основе аналогичных значений «провинция» и «муниципалитет».
Теперь с помощью нечеткой логики c, основанной на значениях «провинция» 'и' муниципалитет 'Я могу отобразить следующим образом (я выбрал только значение, которое имеет самое высокое нечеткое отношение и которое превышает 90): -
Конечный результат: -
province_df2 province_df1 municipality_df1 municipality_df2 barangay
camarines sur camarines sur magarao magarao bell
isabela isabela city of cauayan cauayan city district 2
Ожидаемый результат: -
province_df2 province_df1 municipality_df1 municipality_df2 barangay
camarines sur camarines sur magarao magarao bell
isabela isabela city of cauayan cauayan city district 2
isabela isabela city of cauayan cauayan city andarayan
isabela isabela city of cauayan cauayan city baringin sur
isabela isabela city of cauayan cauayan city buyon
isabela isabela city of cauayan cauayan city cabaruan
isabela isabela city of cauayan cauayan city cabugao
isabela isabela city of cauayan cauayan city pinoma
т.е. я хочу получить все значения barangay, такие как 'brgy bell', 'brgy. «колокол» и «колокол» должны рассматриваться как одно и то же имя барангая, «город кауайян» должен рассматриваться как «город кауэй» (1 пробел) и «город кауэй» (2 пробела) и «магарао» должны быть похожими в «Магарао» и «город Магарао».