Невозможно запустить PCA для набора данных - PullRequest
0 голосов
/ 21 октября 2019

Я пытаюсь запустить PCA для набора данных ссуды - найдите test здесь и train .

Фрагмент кода выглядит следующим образом:

from sklearn.decomposition import PCA
pca = PCA(n_components = 2)
X_train = pca.fit_transform(X_train)
X_test = pca.transform(X_test)
explained_variance = pca.explained_variance_ratio_

Однако, при запуске того же самого, я получаю следующую ошибку:

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-102-829bdba63de3> in <module>
      3 pca = PCA(n_components = 2)
      4 X_train = pca.fit_transform(X_train)
----> 5 X_test = pca.transform(X_test)
      6 explained_variance = pca.explained_variance_ratio_

C:\Anaconda\lib\site-packages\sklearn\decomposition\base.py in transform(self, X)
    127         X = check_array(X)
    128         if self.mean_ is not None:
--> 129             X = X - self.mean_
    130         X_transformed = np.dot(X, self.components_.T)
    131         if self.whiten:

ValueError: operands could not be broadcast together with shapes (185,112) (2,) 

Может кто-нибудь помочь мне в этом? Я не знаю, где я иду не так.

1 Ответ

1 голос
/ 21 октября 2019

Для выполнения PCA требуется только:

import numpy as np
from sklearn.decomposition import PCA
X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
pca = PCA(n_components=2)
pca.fit(X) 

Возможно, вам следует сбросить ярлыки на поезде, присоединиться к тестированию и тренировке, а затем пройти PCA.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...