У меня есть разреженные матрицы TruncatedSVD с размерами 810 * 74. Я пытаюсь кластеризоваться с помощью алгоритма MeanShift на основе центроида, используя sklearn api. Тем не менее, я не смог найти информацию о измерении расстояния, которое средство по умолчанию использует по умолчанию, ни в документации sklearn, ни в онлайн-блогах. Также нет возможности предоставить предварительно вычисленные матрицы расстояний. Meanshift вычисляет евклидово расстояние по умолчанию перед вычислением на основе центроидов?
Пролистал документацию sklearn - https://scikit -learn.org / stable / modules / generate / sklearn.cluster.MeanShift.html
Также искали в Интернете, но без везения
Он не использует расстояния напрямую.
Используется ядро RBF , которое, однако, содержит что-то похожее на евклидово расстояние внутри.
Я сомневаюсь, что это хороший выбор для 74-мерных данных.