У меня есть около 150 000 строк в CSV-файле и я получаю «Ошибка памяти» в операторе for sims in index
.
Не могли бы вы посоветовать мне, как извлечь значения в объекте Similarity без получения ошибки памяти.
corpus = [dictionary.doc2bow(text) for text in terms_list]
similarity_matrix = []
index = gensim.similarities.Similarity('E:\\cm_test',corpus,len(dictionary))
for sims in index:
similarity_matrix.append(sims)
similarity_array = np.array(similarity_matrix)