Масштабирование однозначных закодированных переменных для PCA - PullRequest
0 голосов
/ 22 мая 2018

У меня есть данные со смесью непрерывных и категориальных переменных.Я планирую однозначно кодировать категориальные переменные, масштабировать набор данных (среднее = 0, стандартное = 1) и затем выполнять PCA, чтобы уменьшить количество измерений.Мне нужно знать, должен ли я так же масштабировать закодированные переменные в одно касание, прежде чем делать PCA?Для этого я буду использовать пакет python scikit-learn.

1 Ответ

0 голосов
/ 09 августа 2018

Я думаю, этот ответ на аналогичный вопрос по SO имеет отношение .Также есть общее обсуждение StackExchange: https://stats.stackexchange.com/questions/5774/can-principal-component-analysis-be-applied-to-datasets-containing-a-mix-of-cont. Однако, он вводит пакет только в R.

Единственный пакет в python, который мне удалось найти, это: https://github.com/MaxHalford/prince. Обратите внимание, что это частный пакет, поэтому не следует ожидать широкой поддержки за пределами свободного времени сопровождающего.В этом пакете FAMD находится соответствующий инструмент, который в данный момент находится в стадии разработки / отладки.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...