from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_samples, silhouette_score
X, y = make_blobs(n_samples=500,
n_features=2,
centers=4,
cluster_std=1,
center_box=(-10.0, 10.0),
shuffle=True,
random_state=1)
sil=[]
#start the cluster range from 2
range_n_clusters = range(2,10)
for n_clusters in range_n_clusters:
clusterer = KMeans(n_clusters=n_clusters, random_state=10)
cluster_labels = clusterer.fit_predict(X)
silhouette_avg = silhouette_score(X, cluster_labels)
print("For n_clusters =", n_clusters,
"The average silhouette_score is :", silhouette_avg)
sil.append(silhouette_avg)
Это пример кластеризации Kmeans, примененной к случайной выборке, и поиска наилучшего кластера на основе оценки силуэта. Я думаю, что это поможет вам или, пожалуйста, предоставьте гораздо больше информации