Метод подгонки gensim.sklearn_api.w2vmodel.W2VTransformer выдает ошибку при вводе двумерного массива строк - PullRequest
0 голосов
/ 25 мая 2018

Я пытаюсь кластеризовать некоторые документы с word2vec и numpy.

w2v = W2VTransformer() X_train = w2v.fit_transform(X_train)

Когда я запускаю команду fit или fit_transform, я получаю эту ошибку:

Исключение в потоке Thread-8: трассировка (последний последний вызов): файл "C: \ Users \ lperona \ AppData \ Local \ Continuum \ anaconda3 \ lib \ threading.py", строка 916, в _bootstrap_inner self.run () Файл "C: \ Users \ lperona \ AppData \ Local \ Continuum \ anaconda3 \ lib \ threading.py", строка 864, в запуске self._target (* self._args, ** self._kwargs) Файл "C: \Пользователи \ lperona \ AppData \ Local \ Continuum \ anaconda3 \ lib \ site-packages \ gensim \ models \ base_any2vec.py ", строка 99, в файле _worker_loop, raw_tally = self._do_train_job (data_iterable, job_parameters, thread_private_mem) Файл" C:\ Users \ lperona \ AppData \ Local \ Continuum \ anaconda3 \ lib \ site-packages \ gensim \ models \ word2vec.py ", строка 539, в _do_train_job tally + = train_batch_cbow (self, предложения, alpha, work, neu1, self.compute_loss) Файл "gensim / models / word2vec_inner.pyx", строка 458, в gensim.models.word2vec_inner.train_batch_cbow ValueError: Значение истинности массива с более чем одним элементом неоднозначно.Используйте a.any () или a.all ()

(X_train - это двумерный массив строк)

Кто-нибудь знает решение?Спасибо

1 Ответ

0 голосов
/ 29 августа 2018

Кажется, что у gensim's word2vec есть некоторые проблемы при работе с массивами numpy.Преобразование данных в списки Python помогло мне.

...