Какую меру расстояния использует алгоритм смещения на основе центроида для кластеризации? - PullRequest
0 голосов
/ 26 апреля 2019

У меня есть разреженные матрицы TruncatedSVD с размерами 810 * 74. Я пытаюсь кластеризоваться с помощью алгоритма MeanShift на основе центроида, используя sklearn api. Тем не менее, я не смог найти информацию о измерении расстояния, которое средство по умолчанию использует по умолчанию, ни в документации sklearn, ни в онлайн-блогах. Также нет возможности предоставить предварительно вычисленные матрицы расстояний. Meanshift вычисляет евклидово расстояние по умолчанию перед вычислением на основе центроидов?

Пролистал документацию sklearn - https://scikit -learn.org / stable / modules / generate / sklearn.cluster.MeanShift.html

Также искали в Интернете, но без везения

1 Ответ

0 голосов
/ 26 апреля 2019

Он не использует расстояния напрямую.

Используется ядро ​​ RBF , которое, однако, содержит что-то похожее на евклидово расстояние внутри.

Я сомневаюсь, что это хороший выбор для 74-мерных данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...