Question

У меня есть данные со смесью непрерывных и категориальных переменных.Я планирую однозначно кодировать категориальные переменные, масштабировать набор данных (среднее = 0, стандартное = 1) и затем выполнять PCA, чтобы уменьшить количество измерений.Мне нужно знать, должен ли я так же масштабировать закодированные переменные в одно касание, прежде чем делать PCA?Для этого я буду использовать пакет python scikit-learn.

Mykhailo Lisovyi · Answer 1 · 09 августа 2018

Я думаю, этот ответ на аналогичный вопрос по SO имеет отношение .Также есть общее обсуждение StackExchange: https://stats.stackexchange.com/questions/5774/can-principal-component-analysis-be-applied-to-datasets-containing-a-mix-of-cont. Однако, он вводит пакет только в R.

Единственный пакет в python, который мне удалось найти, это: https://github.com/MaxHalford/prince. Обратите внимание, что это частный пакет, поэтому не следует ожидать широкой поддержки за пределами свободного времени сопровождающего.В этом пакете FAMD находится соответствующий инструмент, который в данный момент находится в стадии разработки / отладки.

Масштабирование однозначных закодированных переменных для PCA

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Масштабирование однозначных закодированных переменных для PCA

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы