Вычисление парного косинуса-сходства, нехватка памяти - PullRequest
0 голосов
/ 08 ноября 2019

Я строю Рекомендательную систему , используя методы фильтрации, и я хочу вычислить попарно косинусное сходство . Форма tfidf_matrix: (45466, 75827).

from sklearn.metrics.pairwise import linear_kernel

cosine_sim = linear_kernel(tfidf_matrix, tfidf_matrix)

Когда я запускаю это для больших текстовых данных, машине не хватает памяти .

Чтоможет быть альтернатива для расчета этого?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...