У нас есть два фрейма данных
фрейм данных 1 ::
фрейм данных 2:
необходимо проверить те же данные во втором наборе данных в объединенном столбце и добавить столбец идентификатора из первого набора данных
означает вывод, подобный ::
!pip install fuzzywuzzy
from fuzzywuzzy import fuzz
data = pd.read_csv(dataframe 1)
df = pd.read_csv(dataframe 2)
word = data['data'].tolist()
find = df['combined'].tolist()
df_final = pd.DataFrame(columns=['combined','id'])
for j in find:
j = str(j)
for i in word:
if i:
i = str(i)
Token_Sort_Ratio = fuzz.token_sort_ratio(j,i)
if Token_Sort_Ratio > 70:
#print(i)
final = data[data.data == i]
df1 = df[df.combined == j]
df_final['id']=df_final['id'].append(final['id'],ignore_index=True)
df_final['combined']= df_final['combined'].append(df1['combined'],ignore_index=True)
Но данные не добавляются в набор данных df_final, пожалуйста, помогите мне в этом. после этого мы планируем объединить df_final и dataframe 2 в комбинированном столбце
, пожалуйста, не стесняйтесь предлагать, если у вас есть какое-либо другое решение, кроме этого