Я пытаюсь передать вложения word2vec в Kmeasn algo.Я использую библиотеку nltk и библиотеки scikitlearn для Kmeans, но у меня возникают проблемы с измерениями
Я использую этот урок как справочник*
Всего кластеров
CLUSTER_NUMS=25
kmeans_clustering = KMeansClusterer(CLUSTER_NUMS, distance=nltk.cluster.util.euclidean_distance, repeats=25)
cluster_assigned = kmeans_clustering.cluster(w2v_sentence_embeddings, assign_clusters=True)
print (cluster_assigned)
for index, sentence in enumerate(sentences):
print (str(cluster_assigned[index]) + ":" + str(sentence))
ValueError: setting an array element with a sequence. with Scikit Learn
alueError: operands could not be broadcast together with shapes (0,) (100,) with NLTK Kmeans