Как узнать, что представляет собой кластер на биплоте PCA? - PullRequest
0 голосов
/ 22 сентября 2019

Я строю алгоритм K означает, и у меня есть несколько переменных для подачи в него.В связи с этим я использую PCA для преобразования данных в два измерения.Когда я отображаю биплот PCA, я не понимаю, какие сходства должны быть сгруппированы в конкретный кластер.Я использую набор данных сегментации клиентов.IE: я хочу знать, что конкретный кластер - это кластер, так как клиент имеет низкий доход, но тратит много денег на продукты.

1 Ответ

0 голосов
/ 23 сентября 2019

Поскольку вы используете k-means:

Вычислите среднее значение для каждого кластера на исходных данных.Теперь вы можете сравнить эти атрибуты.

В качестве альтернативы: не используйте PCA в первую очередь, если у вас был ваш анализ ... k-means так же хорошо, как PCA, справляется с несколькими дюжинами переменных.

...