Обучение без учителя уменьшает размерность / кластеризацию - PullRequest
0 голосов
/ 01 июля 2018

Я пытаюсь понять, как я могу разделить мои данные на кластеры, используя обучение без учителя. Например, метод k-средних.

У меня есть 20 столбцов данных, и как их можно спроецировать на 2D-поверхность без потери необходимой информации из 18 столбцов?

Что я должен использовать для этого?

Любая помощь будет оценена.

1 Ответ

0 голосов
/ 01 июля 2018

Если вы просто заинтересованы в просмотре ваших данных в двух измерениях, рассмотрите возможность использования t-SNE. Пакет scikit-learn python имеет отличную реализацию, которую вы можете использовать. Однако помните, что вы не должны кластеризовать свои данные на выходе t-SNE, так как пространство, в котором находятся ваши данные, становится достаточно искаженным в процессе (поддерживаются только короткие расстояния, тогда как большие расстояния сильно изменяются, чтобы быть либо короче, либо дольше)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...