ввод: фраза 1, фраза 2
вывод: значение семантического сходства (между 0 и 1) или вероятность того, что эти две фразы говорят об одном и том же
Взгляните на http://mkusner.github.io/publications/WMD.pdf В этой статье описывается алгоритм, называемый расстоянием Word Mover, который пытается раскрыть семантическое сходство. Он опирается на баллы сходства, как диктуется word2vec. Интеграция этого с GoogleNews-vector-отрицательным 300 дает желаемые результаты.