У меня проблема с онлайн-обновлением модели Word2Vec.
У меня есть документ и модель сборки по нему.Но этот документ может обновляться новыми словами, и мне нужно обновить словарный запас и модель в целом.
Я знаю, что в gensim 0.13.4.1 мы можем сделать это
Мой код:
model = gensim.models.Word2Vec(size=100, window=10, min_count=5, workers=11, alpha=0.025, min_alpha=0.025, iter=20)
model.build_vocab(sentences, update=False)
model.train(sentences, epochs=model.iter, total_examples=model.corpus_count)
model.save('model.bin')
И после этого у меня появились новые слова.Например:
sen2 = [['absd', 'jadoih', 'sdohf'], ['asdihf', 'oisdh', 'oiswhefo'], ['a', 'v', 'b', 'c'], ['q', 'q', 'q']]
model.build_vocab(sen2, update=True)
model.train(sen2, epochs=model.iter, total_examples=model.corpus_count)
Что не так и как я могу решить мою проблему?