Векторы слов из всей модели doc2vec против векторов слов из конкретного документа - PullRequest
0 голосов
/ 01 мая 2019

Я обучил модель Doc2Vec от gensim с обучением по умолчанию word2vec (dm = 1).Я могу получить векторы слов из глобальной модели в model.wv.vectors.Но документация гласит, что одно и то же слово (в данном примере «листья») не будет иметь один и тот же вектор в зависимости от контекста документа, в котором он появляется.

Так что я немногоперепутано: будет ли в примере model.wv.vectors слово «листья» иметь один и тот же вектор для всех документов, используемых для обучения модели (что может противоречить тому, что я понимаю из документации)?Если нет, как получить векторы слов из определенного документа?

1 Ответ

0 голосов
/ 01 мая 2019

Эта документация вводит в заблуждение. Слово-маркер 'leaves' будет иметь только один слово-вектор в этой модели.

Я предполагаю, что автор этого комментария может означал, что во время обучения модели в режиме PV-DM (dm=1) на предсказания обучения будет влиять комбинация слова -vector и «плавающий» вектор документа для этого текста (и других соседних слов-векторов в контекстном окне). Но, тем не менее, одно слово имеет только один вектор, и описание в нем запутано.

...