Параметры обучения модели Википедии - PullRequest
0 голосов
/ 27 декабря 2018

Предварительно обученные модели английской и другой языковой википедии доступны здесь ...

https://wikipedia2vec.github.io/wikipedia2vec/pretrained/

В чем разница между 100d и 500d в случае английской википедии?

И что эти параметры означают для обучения (окно = 5, итерация = 10, отрицательное = 15)

1 Ответ

0 голосов
/ 27 декабря 2018

Значения 100d, 500d относятся к измерению встраивания слов, см. Word2Vec , словарь составляется из уникальных слов, и каждое слово внедряется в форме вектора данного измерения вложения.

Окно 5 будет относиться к модели n-грамм , где для определения контекста используется окно из 5 слов.

Я не совсем уверен в итерации иотрицательно однако.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...