Может ли модель word2vec использоваться для слов, а также в качестве обучающих данных вместо предложений - PullRequest
0 голосов
/ 30 апреля 2019

В Word2vec мы можем использовать слова вместо предложений для обучения модели

Как показано ниже, код gberg_sents - это токены предложений. модель = Word2Vec (предложения = gberg_sents, размер = 64, sg = 1, окно = 10, min_count = 5, семя = 42, рабочие = 8)

Таким образом, мы можем также использовать жетоны слова

1 Ответ

1 голос
/ 30 апреля 2019

Нет, word2vec обучается с целью моделирования языка, то есть он предсказывает, какие слова появляются в окружении других слов.Для этого ваши данные должны быть фактическими предложениями, которые показывают, как слова используются в контексте.Это на самом деле контекст слов, который дает вам информацию, которая содержится во вложениях.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...