Роль зависимых переменных в кластеризации Kmeans - PullRequest
0 голосов
/ 01 июля 2019

У меня есть две переменные в моих данных, которые зависят друг от друга. Мне нужно выполнить K означает кластеризацию на моем наборе данных. Мне нужно отбросить одну переменную перед выполнением k означает кластеризацию, или обе переменные могут быть введены в качестве входных данныхк алгоритму. Любая помощь будет весьма заметна.

Ответы [ 2 ]

0 голосов
/ 03 июля 2019

Если отношения очень крепкие, это буквально не должно иметь значения.

Почему бы вам просто не попробовать и сравнить результаты? Это имеет значение?

0 голосов
/ 02 июля 2019

Нет, нет необходимости сводить его к одному измерению, поскольку у вас есть только 2 переменные. Но если вы не получаете хороших результатов, я предлагаю использовать PCA или TSNE и, возможно, затем использовать KMEANS для преобразованных данных. Но все это зависит от вашей проблемы, конечно.

...