функция gensim предсказать выходные слова - PullRequest
0 голосов
/ 29 июня 2018

Я использую библиотеку gensim для создания модели word2vec. Он содержит функцию predict_output_words(), которую я понимаю следующим образом:

1003

и затем я использую

model.predict_output_words(context_words_list=['Anarchism', 'does', 'not', 'offer', 'a', 'fixed', 'body', 'of', 'from', 'a', 'single', 'particular', 'world', 'view', 'instead', 'fluxing'], topn=10).

В этой ситуации, могу ли я получить / предсказать правильное слово или пропущенное слово «доктрина»?

Это правильный путь? Пожалуйста, объясните эту функцию подробно.

1 Ответ

0 голосов
/ 02 июля 2018

Мне интересно, видели ли вы документацию predict_output_word?

Сообщить о распределении вероятностей центрального слова с учетом контекстные слова как входные данные для обученной модели.

Чтобы ответить на ваш конкретный вопрос о слове «доктрина» - это сильно зависит от того, является ли для слов, которые вы указали в качестве контекста, одним из 10 наиболее вероятных слов «доктрина». Это означает, что это должно происходить относительно часто в корпусе, который вы используете для обучения модели. Кроме того, поскольку «доктрина» не является одним из часто используемых слов, существует большая вероятность того, что другие слова будут иметь более высокую вероятность появления в контексте. Поэтому, если вы основываетесь только на возвращенной вероятности слов с учетом контекста, вы можете в конечном итоге не предсказать «доктрину» в этом случае.

...