Найдите оценку достоверности предложения / сходство с моделью word2ve c - PullRequest
0 голосов
/ 18 июня 2020

Я создал две разные модели word2ve c для двух разных тем или категорий.

Теперь, если я введу новое предложение в качестве входных данных, как я могу рассчитать оценку достоверности этого предложения как для модели. Я имею в виду, как мне рассчитать процентное сходство или близость предложений с обеими моделями?

Можно ли получить объединенный вектор для одной модели, чтобы я мог сравнить его с вектором нового предложения.

Пример -

Допустим, я создал две модели word2ve c для СПОРТА и АКАДЕМИИ. Я создал обе модели, используя различные предложения, предварительную обработку и т. Д. c.

Теперь, скажем, я даю предложение, которое представляет собой смесь СПОРТА и АКАДЕМИИ. насколько мое предложение находится в контексте СПОРТА и сколько в АКАДЕМИИ с использованием уже существующей модели и вектора этого нового предложения?

Например, могу ли я сказать, что мое новое предложение имеет 70% сходство с моделью СПОРТ и 50% сходства с академической моделью?

...