Как показать коэффициент подобия Жакара определенным образом? - PullRequest
0 голосов
/ 23 сентября 2019

Я хочу показать коэффициент сходства по Джакарду между столбцом Компонент1 и Компонент2, чтобы все элементы в столбце1 были созданы как разные столбцы с соответствующим коэффициентом сходства по Джакарду ( пример ).

Я рассчитал коэффициент подобия Жакара между Компонентом1 и Компонентом2.Я также создал отдельный фрейм данных, но не могу ввести требуемый коэффициент подобия Джакарда в новые столбцы.

For jaccard distance :
def jaccard_similarity(query, document):
    intersection = set(query).intersection(set(document))
    union = set(query).union(set(document))
    return len(intersection)/len(union)

col_list = ['Apple','Ball','XYZ' , 'Mango']


final_df = pd.DataFrame(columns=col_list)

for i in range(0, len(col_list)):
    for j in range(0, len(tokenized_row_columns2)):
        final_df = final_df.append({col_list[i]: jaccard_similarity(tokenized_row_columns1[i],tokenized_row_columns2[j])},ignore_index=True)

Столбец 1 и столбец 2 - это входные данные в показанном файле , в то время какостальные столбцы - ожидаемые результаты.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...