Минимальное значение 0
, но максимальное может быть больше 1
.
Из документации:
Этот индекс означает среднее «сходство» между кластерами, где сходство - это мера, которая сравнивает расстояние между кластерами с размером самих кластеров.
Ноль - это минимально возможная оценка. Значения, близкие к нулю, указывают на лучшее разделение.
Пример, когда оценка> 1:
from sklearn import datasets
from sklearn.cluster import KMeans
from sklearn.metrics import davies_bouldin_score
iris = datasets.load_iris()
X = iris.data
kmeans = KMeans(n_clusters=13, random_state=1).fit(X)
labels = kmeans.labels_
davies_bouldin_score(X, labels)
1.068885319440245