В sklearn мы можем сравнить модель гауссовой смеси на основе BIC.
https://scikit -learn.org / стабильный / модули / генерироваться / sklearn.mixture.GaussianMixture.html # sklearn.mixture.GaussianMixture.bic
Существует ли аналогичный способ в pyspark.ml использовать метрику для выбора оптимального числа кластеров для модели гауссовой смеси?