MemoryError
означает, что недостаточно памяти для завершения операции.
Сколько векторов в вашем наборе 'it-vectors.100.5.50.w2v'?
Обратите внимание, что cosine_similarity()
создает (nxn) матрицу результатов.Поэтому, если в вашем наборе 100 000 векторов, вам понадобится массив результатов размером:
100,000^2 * 4 bytes/float = 40GB
У вас так много адресуемой памяти?