Как загрузить осколки индекса с помощью gensim.shoities.Shohood? - PullRequest
0 голосов
/ 07 мая 2018

Я работаю над чем-то, используя gensim.

В gensim var index обычно означает объект gensim.similarities.<cls>.

Сначала я использую gensim.similarities.Similarity(filepath, ...) для сохранения индекса в виде файла, а затем загружаю его на gensim.similarities.Similarity.load(filepath + '.0'). Потому что gensim.similarities.Similarity Индекс сохранения по умолчанию для файла осколков, такой как index.0.

Когда индексный файл становится больше, он автоматически разделяется на несколько осколков, например index.0, index.1, index.2 ......

Как я могу загрузить файл этих осколков? gensim.similarities.Similarity.load() может загрузить только один файл.

Кстати: я пытался найти ответ в документе Генсима, но не смог.

1 Ответ

0 голосов
/ 25 июня 2019
from gensim.corpora.textcorpus import TextCorpus
from gensim.test.utils import datapath, get_tmpfile
from gensim.similarities import Similarity

temp_fname = get_tmpfile("index")
output_fname = get_tmpfile("saved_index")
corpus = TextCorpus(datapath('testcorpus.txt'))
index = Similarity(output_fname, corpus, num_features=400)

index.save(output_fname)
loaded_index = index.load(output_fname)

https://radimrehurek.com/gensim/similarities/docsim.html

...