Маркируйте запрос-документ так же, как данные обучения.Передайте эти токены методу Doc2Vec
модели *1001*, чтобы получить вектор для документа запроса.Передайте этот вектор в most_similar()
, чтобы получить ранжированный список известных документов, подобных этому вектору.
Есть примеры использования infer_vector()
таким образом в ячейках 10 и далее в другой демонстрационной записной книжке, включенной в gensim
:
https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/doc2vec-lee.ipynb