Ошибка памяти для матрицы подобия для большого количества строк (gensim) - PullRequest
0 голосов
/ 02 ноября 2019

У меня есть около 150 000 строк в CSV-файле и я получаю «Ошибка памяти» в операторе for sims in index.
Не могли бы вы посоветовать мне, как извлечь значения в объекте Similarity без получения ошибки памяти.

corpus = [dictionary.doc2bow(text) for text in terms_list]
similarity_matrix = []

index = gensim.similarities.Similarity('E:\\cm_test',corpus,len(dictionary))

for sims in index:

    similarity_matrix.append(sims)

similarity_array = np.array(similarity_matrix)
...