Каков наилучший метод предварительной обработки перед алгоритмом кластеризации? - PullRequest
0 голосов
/ 12 марта 2019

мои данные содержат несколько функций на уровне пользователя.и мое желание состоит в том, чтобы объединить их в несколько групп, основываясь на этих характеристиках, и мои данные искажены наличием экстремальных выбросов для некоторых функций.мой вопрос, что является лучшим методом предварительной обработки перед алгоритмом кластеризации?

1 Ответ

0 голосов
/ 14 марта 2019

Лучшая практика для кластеризации - сначала выяснить, как надежно измерить расстояние.Затем можно попробовать многие методы кластеризации.

Но прежде чем вы сможете количественно оценить различия, данные не могут использоваться для большинства кластеров.

...