Вы можете использовать метод NearestCentroid из модуля sklearn, чтобы получить кластер HDBSCAN. В моем случае я использовал следующую функцию для получения центров кластеров:
from sklearn.neighbors.nearest_centroid import NearestCentroid
def get_cluster_centers(self, clustering_df= None, metrics_by_col='CLUSTER_NO'):
model_cols=['CREATEDTTM','LAT_GEOCODER','LNG_GEOCODER']
clf = NearestCentroid()
clf.fit(clustering_df[model_cols],clustering_df[metrics_by_col])
centers_df=pd.DataFrame(clf.centroids_,columns=model_cols)
centers_df['classes']=clf.classes_
centers_df.set_index('classes', inplace= True)
return centers_df
clustering_df - это масштабированный фрейм данных. Вы всегда должны использовать нормализованные данные для процесса кластеризации.