Я только что запустил PCA, а затем алгоритм кластеризации K-средних для своих данных, после запуска алгоритма я получил 3 кластера. Я пытаюсь выяснить, к каким кластерам принадлежит мой вход, чтобы собрать некоторые качественные атрибуты ввода. Мой ввод - это идентификатор клиента, а переменные, которые я использовал для кластеризации, были структурами расходов на определенные продукты
Ниже приведен код, который я запустил для K, в поисках некоторых входных данных о том, как сопоставить их с исходными данными, чтобы увидеть, к какому кластеру относится вход:
kmeans= KMeans(n_clusters=3)
X_clustered=kmeans.fit_predict(x_10d)
LABEL_COLOR_MAP = {0:'r', 1 : 'g' ,2 : 'b'}
label_color=[LABEL_COLOR_MAP[l] for l in X_clustered]
#plot the scatter diagram
plt.figure(figsize=(7,7))
plt.scatter(x_10d[:,0],x_10d[:,2] , c=label_color, alpha=0.5)
plt.show()
Спасибо