Рассчитать косинус сходства и изменить - PullRequest
0 голосов
/ 18 декабря 2018

У меня есть документ, похожий на этот:

введите описание изображения здесь

Я хочу вычислить косинусные сходства каждой строки в Excel.Код, который я написал до сих пор:

df = pd.read_csv('example.csv',encoding="ISO-8859-1")
similarities = df['value'].values.tolist()
tfidf_vectorizer = TfidfVectorizer()
tfidf_matrix = tfidf_vectorizer.fit_transform(similarities)  
cosine_similarity(tfidf_matrix, tfidf_matrix)

Возвращает матрицу 4X4.Есть ли способ изменить матрицу в следующий формат? введите описание изображения здесь

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...