Есть ли поддержка BiPlots при использовании PCA в spark.ml? - PullRequest
0 голосов
/ 10 сентября 2018

Я использовал kmeans и PCA, чтобы попытаться визуализировать многомерные кластеры k-средних в двух измерениях, но потерял смысл кластеров в 2D.

Есть ли способ проецировать объекты на 2D-график?вернуть некоторую интерпретируемость?

1 Ответ

0 голосов
/ 05 октября 2018

Любой метод нелинейного уменьшения размерности мог бы работать лучше (также называемый "изучением многообразия", например, см. набор sklearn ). Метод t-sne обычно довольно популярен для этого.

Однако они не учитывают метки вашего кластера. Если вы хотите это сделать (хотя, как правило, вы не ), вы можете добавить штраф к методике обучения многообразия, которая, например, заставляет точки одного кластера быть близко друг к другу.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...