Значения по умолчанию для doc2vec для альфы и min_alpha - PullRequest
1 голос
/ 16 октября 2019

Кто-нибудь может мне сказать, какие значения по умолчанию используются в Doc2Vec() для alpha и min_alpha?

1 Ответ

1 голос
/ 16 октября 2019

Точные значения по умолчанию для всех параметров перечислены в документации, но для параметров, используемых совместно с «базовым» классом, могут быть указаны в документах этого суперкласса.

То есть, когда вы не видите alpha и min_alpha, показанные на строке прототипа Doc2Vec документации ....

https://radimrehurek.com/gensim/models/doc2vec.html#gensim.models.doc2vec.Doc2Vec

... вы можете щелкнуть там ссылку на его базовый класс BaseWordEmbeddingsModel и найти указанные и многие другие значения по умолчанию:

https://radimrehurek.com/gensim/models/base_any2vec.html#gensim.models.base_any2vec.BaseWordEmbeddingsModel

В частности, согласно тексту там ...

class gensim.models.base_any2vec.BaseWordEmbeddingsModel (предложения = нет, corpus_file = нет, работники = 3, вектор_size = 100, эпох = 5, обратные вызовы = (), пакетные слова = 10000, trim_rule = нет, sg = 0, альфа = 0,025 , окно = 5, начальное число = 1, hs = 0, отрицательное значение = 5, ns_exponent = 0,75, cbow_mean = 1, min_alpha = 0,0001 , compute_loss= False, fast_version = 0, ** kwargs)

... значения по умолчанию alpha=0.025, min_alpha=0.0001.

Большинству пользователей вообще не нужно возиться с этим: большинствоУсилия по оптимизации метапараметра должны быть направлены в другое место.

В некоторых опубликованных работах, в некоторых режимах этого и связанных алгоритмов, я видел более высокое начальное значение alpha из 0.05 или 0.1.

...