Question

У меня есть около 150 000 строк в CSV-файле и я получаю «Ошибка памяти» в операторе for sims in index.
Не могли бы вы посоветовать мне, как извлечь значения в объекте Similarity без получения ошибки памяти.

corpus = [dictionary.doc2bow(text) for text in terms_list]
similarity_matrix = []

index = gensim.similarities.Similarity('E:\\cm_test',corpus,len(dictionary))

for sims in index:

    similarity_matrix.append(sims)

similarity_array = np.array(similarity_matrix)

Ошибка памяти для матрицы подобия для большого количества строк (gensim)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Ошибка памяти для матрицы подобия для большого количества строк (gensim)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы