Я работаю над набором данных о диабете индейцев PIMA. Во-первых, я нормализовал данные. Сейчас я пытаюсь применить PCA. Я должен получить 2 основных компонента, которые имеют 65% корреляцию, после применения PCA. Как я могу получить 2 основных компонента с 65% корреляцией? Я попробовал данный код ниже. z
- нормализованный набор данных.
from sklearn.decomposition import PCA
pca = PCA(n_components=2)
pca.fit(z)
x_pca = pca.transform(z)
from scipy.stats import pearsonr
x_pca=pd.DataFrame(x_pca)
corr,_= pearsonr(x_pca[0],x_pca[1])
corr
Результат, полученный для приведенного выше кода: 3.936155403651279e-16
.