Я хочу показать коэффициент сходства по Джакарду между столбцом Компонент1 и Компонент2, чтобы все элементы в столбце1 были созданы как разные столбцы с соответствующим коэффициентом сходства по Джакарду ( пример ).
Я рассчитал коэффициент подобия Жакара между Компонентом1 и Компонентом2.Я также создал отдельный фрейм данных, но не могу ввести требуемый коэффициент подобия Джакарда в новые столбцы.
For jaccard distance :
def jaccard_similarity(query, document):
intersection = set(query).intersection(set(document))
union = set(query).union(set(document))
return len(intersection)/len(union)
col_list = ['Apple','Ball','XYZ' , 'Mango']
final_df = pd.DataFrame(columns=col_list)
for i in range(0, len(col_list)):
for j in range(0, len(tokenized_row_columns2)):
final_df = final_df.append({col_list[i]: jaccard_similarity(tokenized_row_columns1[i],tokenized_row_columns2[j])},ignore_index=True)
Столбец 1 и столбец 2 - это входные данные в показанном файле , в то время какостальные столбцы - ожидаемые результаты.