PCA дает равные значения в объясненной_вариантности после масштабирования для набора 2D-данных - PullRequest
0 голосов
/ 06 марта 2019

У меня есть 2D-набор данных, и я хочу применить PCA, чтобы уменьшить его до 1D, вот как это выглядит:

age thalach
0   63  150
1   37  187
2   41  172
3   56  178
4   57  163

Если я не применяю масштабирование, я получаю следующий результат

pca = PCA(n_components=1)
pca.fit_transform(age_thalach)
print(pca.components_)

[[ 0.17842085 -0.98395427]] that is meaninful, I see that second component explains more

Но я узнал, что без масштабирования PCA может работать некорректно И если я применяю масштабирование, я получаю результаты, которые не могу интерпретировать:

scaler = StandardScaler()
age_thalach=pd.DataFrame(scaler.fit_transform(age_thalach))
print(pca.components_)

[[-0.70710678  0.70710678]]

Что это значит? Почему после масштабирования обе функции объясняют одинаковое соотношение информации? Заранее спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...