Многопоточный расчет косинусного сходства на большом наборе данных - PullRequest
0 голосов
/ 06 февраля 2019

Я хочу вычислить косинусное сходство двух матриц, используя многопоточность

from sklearn.feature_extraction.text import CountVectorizer

count_vect = CountVectorizer()
df_series = count_vect.fit_transform(df.Series) 
df_series.shape 

from sklearn.feature_extraction.text import TfidfTransformer

tfidf_transformer = TfidfTransformer() 
df_srtf = tfidf_transformer.fit_transform(df_series) 

from sklearn.metrics.pairwise import cosine_similarity

SR=cosine_similarity(df_srtf)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...