У меня есть документ, похожий на этот:
введите описание изображения здесь
Я хочу вычислить косинусные сходства каждой строки в Excel.Код, который я написал до сих пор:
df = pd.read_csv('example.csv',encoding="ISO-8859-1")
similarities = df['value'].values.tolist()
tfidf_vectorizer = TfidfVectorizer()
tfidf_matrix = tfidf_vectorizer.fit_transform(similarities)
cosine_similarity(tfidf_matrix, tfidf_matrix)
Возвращает матрицу 4X4.Есть ли способ изменить матрицу в следующий формат? введите описание изображения здесь