Я уже обучил модель gensim doc2Vec, которая находит большинство документов, похожих на неизвестный.
Теперь мне нужно найти значение сходства между двумя неизвестными документами (которых не было в данных обучения, поэтомуна них нельзя ссылаться по идентификатору документа)
d2v_model = doc2vec.Doc2Vec.load(model_file)
string1 = 'this is some random paragraph'
string2 = 'this is another random paragraph'
vec1 = d2v_model.infer_vector(string1.split())
vec2 = d2v_model.infer_vector(string2.split())
в приведенном выше коде vec1 и vec2 успешно инициализируются для некоторых значений и размеров - 'vector_size'
теперь просматривает API-интерфейс gensimи примеры я не мог найти метод, который работает для меня, все они ожидают TaggedDocument
Могу ли я сравнить значение векторов объектов по значению, и если они ближе => тексты более похожи?