Метрики оценки кластеризации Kmeans в pyspark ML lib - PullRequest
1 голос
/ 06 апреля 2020

Может ли кто-нибудь поделиться какими-либо оценочными показателями, используемыми для кластеризации KMeans в библиотеке pyspark ML. За исключением силуэта или SSE, которые я уже рассчитал. Я нашел несколько метрик, но они доступны в библиотеке scikit python, но я работаю в pyspark, например, Calinski-Harabasz Index.

...