Внедрения, сгенерированные из Wordvec в вопросы измерения алгоритма KMeans - PullRequest
0 голосов
/ 25 мая 2019

Я пытаюсь передать вложения word2vec в Kmeasn algo.Я использую библиотеку nltk и библиотеки scikitlearn для Kmeans, но у меня возникают проблемы с измерениями

Я использую этот урок как справочник*

Всего кластеров

CLUSTER_NUMS=25

kmeans_clustering = KMeansClusterer(CLUSTER_NUMS, distance=nltk.cluster.util.euclidean_distance, repeats=25)
cluster_assigned = kmeans_clustering.cluster(w2v_sentence_embeddings, assign_clusters=True)
print (cluster_assigned)

for index, sentence in enumerate(sentences):    
    print (str(cluster_assigned[index]) + ":" + str(sentence))

ValueError: setting an array element with a sequence. with Scikit Learn
alueError: operands could not be broadcast together with shapes (0,) (100,)  with NLTK Kmeans
...