У меня есть фрейм данных с парой столбцов, два из которых Artist_x
и Artist_y
.Я хотел бы найти сходство между этими двумя столбцами и получить процент сходства в качестве нового столбца.Я думаю, что могу использовать difflib, но точно не знаю, как именно.
У меня сейчас есть:
mergednew['SimilarityArtist'] = mergednew.apply(lambda row: similar(row['Artist_x'], row['Artist_y']), axis=1)