Я пытаюсь кластеризовать некоторые документы с word2vec и numpy.
w2v = W2VTransformer()
X_train = w2v.fit_transform(X_train)
Когда я запускаю команду fit или fit_transform, я получаю эту ошибку:
Исключение в потоке Thread-8: трассировка (последний последний вызов): файл "C: \ Users \ lperona \ AppData \ Local \ Continuum \ anaconda3 \ lib \ threading.py", строка 916, в _bootstrap_inner self.run () Файл "C: \ Users \ lperona \ AppData \ Local \ Continuum \ anaconda3 \ lib \ threading.py", строка 864, в запуске self._target (* self._args, ** self._kwargs) Файл "C: \Пользователи \ lperona \ AppData \ Local \ Continuum \ anaconda3 \ lib \ site-packages \ gensim \ models \ base_any2vec.py ", строка 99, в файле _worker_loop, raw_tally = self._do_train_job (data_iterable, job_parameters, thread_private_mem) Файл" C:\ Users \ lperona \ AppData \ Local \ Continuum \ anaconda3 \ lib \ site-packages \ gensim \ models \ word2vec.py ", строка 539, в _do_train_job tally + = train_batch_cbow (self, предложения, alpha, work, neu1, self.compute_loss) Файл "gensim / models / word2vec_inner.pyx", строка 458, в gensim.models.word2vec_inner.train_batch_cbow ValueError: Значение истинности массива с более чем одним элементом неоднозначно.Используйте a.any () или a.all ()
(X_train - это двумерный массив строк)
Кто-нибудь знает решение?Спасибо