R text2vec; rsparse :: GloVe $ new () GlobalVectors $ new () Env Set / Not Set - PullRequest
0 голосов
/ 22 марта 2020

Проблема: R GloVe среда с использованием библиотеки (text2ve c). Установить среду с выполнением кода rsparse :: GloVe $ new (), НО, не устанавливать с выполнением кода GlobalVectors $ new ().

Затем запустил wv_main = glove $ fit_transform (tcm ...), ошибка :

Ошибка в перчатке : Несовместимо с запрошенным типом: [type = S4; target = double].

Поиск справки по перчатке $ fit_transform (tcm) для несовместимого типа запроса.

tokens = space_tokenizer(df_sample)
token_iter = itoken(tokens, progressbar = FALSE)
vocab = create_vocabulary(token_iter)
vocab = prune_vocabulary(vocab, term_count_min = 5L)
vectorizer = vocab_vectorizer(vocab)
tcm = create_tcm(token_iter, vectorizer, skip_grams_window = 5L)
glove = GlobalVectors$new(word_vectors_size = 50, x_max = 10)
glove <- rsparse::GloVe$new(tcm, rank = 50, x_max = 10, learning_rate = .25)
wv_main = glove$fit_transform(tcm, n_iter = 10, convergence_tol = 0.01, n_threads = 8)

dput(glove)
<environment>

1 Ответ

0 голосов
/ 22 марта 2020

Введенный входной термин матрица dgTMatrix для fit_transform () является правильным. Тем не менее, матричная модель факторизации GloVe GloVe $ new (), которая строит модель, требует только параметров для желаемого измерения, максимального количества совпадений, скорости обучения для SGD, альфа, лямбда и тасования. Поэтому GloVe $ new (rank = 50, x_max = 10) без матрицы dgTMatrix (tcm) правильно создает модель GloVe.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...