Как построить данные, а не центроиды с помощью k-средних? - PullRequest
0 голосов
/ 27 декабря 2018

У меня проблемы с поиском способа построения точек данных, окрашенных кластером, с помощью k-средних.

У меня очень длинный список строк. Мне удалось построить центроиды, но не точки данных;

vectorizer = TfidfVectorizer(stop_words='english')
X = vectorizer.fit_transform(cleans)

true_k = 5
model = KMeans(n_clusters=true_k, init='k-means++', max_iter=100, n_init=1)
model.fit(X)
print("Top terms per cluster:")
order_centroids = model.cluster_centers_.argsort()[:, ::-1]
terms = vectorizer.get_feature_names()
for i in range(true_k):
    print("Cluster %d:" % i),
    for ind in order_centroids[i, :10]:
        print(' %s' % terms[ind]),
    print

print("\n")

plt.scatter(order_centroids[:, 0],order_centroids[:, 1], marker="x", s=150, linewidths=5, zorder=10)
plt.show()

Я ожидаю, что на выходе будут точки данных, окрашенные кластером, а не центроиды

...