Как найти главные компоненты из набора данных с корреляцией x%? - PullRequest
0 голосов
/ 30 апреля 2020

Я работаю над набором данных о диабете индейцев PIMA. Во-первых, я нормализовал данные. Сейчас я пытаюсь применить PCA. Я должен получить 2 основных компонента, которые имеют 65% корреляцию, после применения PCA. Как я могу получить 2 основных компонента с 65% корреляцией? Я попробовал данный код ниже. z - нормализованный набор данных.

from sklearn.decomposition import PCA
pca = PCA(n_components=2)
pca.fit(z)
x_pca = pca.transform(z)
from scipy.stats import pearsonr
x_pca=pd.DataFrame(x_pca)
corr,_= pearsonr(x_pca[0],x_pca[1])
corr

Результат, полученный для приведенного выше кода: 3.936155403651279e-16.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...