мои данные содержат несколько функций на уровне пользователя.и мое желание состоит в том, чтобы объединить их в несколько групп, основываясь на этих характеристиках, и мои данные искажены наличием экстремальных выбросов для некоторых функций.мой вопрос, что является лучшим методом предварительной обработки перед алгоритмом кластеризации?