Я сталкиваюсь с проблемой обучения Gensim, используя Word2Vec.model.wv.vocab не получает никаких дополнительных слов от обученного корпуса, только слова из инструкции инициализации!
На самом деле, после того, как я много раз пытался написать собственный код, даже пример с официального сайта не сработал!
Я пытался сохранить модель во многих местах в моем коде. Я даже пытался сохранить и перезагрузить корпус вместе с инструкцией поезда
from gensim.test.utils import common_texts, get_tmpfile
from gensim.models import Word2Vec
path = get_tmpfile("word2vec.model")
model = Word2Vec(common_texts, size=100, window=5, min_count=1, workers=4)
model.save("word2vec.model")
print(len(model.wv.vocab))
model.train([["hello", "world"]], total_examples=1, epochs=1)
model.save("word2vec.model")
print(len(model.wv.vocab))
первый оператор печати дает 12, что правильно
второй 12, когда он должен дать 14 (len (vocab + 'hello' + 'world'))