Я предварительно обучен word2vec
с gensim
.И использование gensim
для нахождения сходства между words
работает как положено.Но у меня проблема с поиском сходства между двумя разными предложениями.Использование cosine
similarities
не является хорошим вариантом для предложений и не дает хорошего результата.Soft Cosine similarities
в gensim
дает немного лучшие результаты, но, тем не менее, он также выглядит не очень хорошо.
Я нашел WMDsimilarities
в gensim
.Это немного лучше, чем softcosine
и cosine
.
Я думаю, есть ли возможность, например, использовать глубокое обучение, такое как keras
и tensorflow
, чтобы найти сходство предложений из предварительно обученного word2vec,Я знаю, что классификация может быть выполнена с использованием word embbeding
, и это кажется несколько лучшими вариантами, но тогда мне нужно найти тренировочные данные и пометить их с нуля.
Итак, мне интересно, есть ли какой-нибудь другой вариант, который можно использовать предварительно обученный word2vec
в keras
и получить предложения сходства.Есть ли способ.Я открыт для любых предложений и советов.