Hej В настоящее время у меня есть 2 диапазона данных из 2 разных файлов Excel
- a = df_Web_Customer
- b = df_Batchlog
Пример
dfa = pd.DataFrame([[Casper May 16 2020], [Kasper Apr 1 2014], [Jonas Jan 15 2016]], columns=['Name'])
dfb = pd.DataFrame([[Casper May 16 2020], [Jonas Apr 1 2014], [Jona Jan 5 2016]], columns=['Name'])
У меня есть функция, которая может сравнивать 2 входа друг с другом: SequenceMatcher
Как мне взять по одной ячейке из Dataframe a и сопоставить ее с каждой ячейкой в Dataframe b? 1014 * КОД:
from difflib import SequenceMatcher
import pandas as pd
#import zip
#Load Web customer to Data frame
data_web_customer = pd.read_excel (r'NewWeb_customer.xlsx')
df_Web_Customer = pd.DataFrame(data_web_customer, columns= ['Name'])
#Load Batchlog to Data frame
data_Batchlog = pd.read_excel (r'BatchlogTestName.xlsx')
df_Batchlog = pd.DataFrame(data_Batchlog, columns= ['Name'])
a=df_Web_Customer
b=df_Batchlog
#LOOP the SIMILAR FUNCTION through each cell??
def similar(a, b):
return SequenceMatcher(None, a, b).ratio()