Попытка сделать нечеткое отображение, когда Dataframes содержат несколько столбцов - PullRequest
0 голосов
/ 23 января 2020

Я пытаюсь сделать нечеткое совпадение, используя pandas fuzzywuzzy. Я получаю вывод, когда фрейм данных имеет только один столбец, но мои фреймы данных содержат несколько столбцов, здесь я должен сравнить 1-й столбец

path1="C:\\Users\\MaddineniS\\Desktop\\a\\Analysis1.xlsx"

Src_Names=pd.read_excel(path1,sheet_name="Second")
Dest_Names=pd.read_excel(path1,sheet_name="Master")

df1=Src_Names[['Source']]
df2=df1['Source'].tolist()

df3=Dest_Names[['Destination']]
df4=df3['Destination'].tolist()

Ratios = (process.extract(x,df4) for x in df2)
result = list()
for ratio in Ratios:
    for match in ratio:
        if match[1] >= 85: 
            result.append(match)
            break

print(result)

Вывод: если в фреймах данных есть один столбец

[('PINEWOOD TECHNOLOGIES LTD', 90), ('Imi', 90), ('(THUS RESELLER) EDGE DISTRIBUTION LTD', 90), ('TD', 90), ('THUS(R)', 90), ('CARE', 90), ('THUS RESELLER PURE MOBILE LTD', 86), ('TD', 90), ('(THUS RESELLER) D R COMMUNICATIONS LTD', 90), ('ADAM PHONES LT', 90), ('VODAFONE ONENET UK (INTERNAL)', 100)]
...