Усеченная СВД отнимает много времени - PullRequest
1 голос
/ 13 мая 2019

Я пытаюсь уменьшить размерность набора данных, вычисляя лучшие n_компоненты, используя усеченный SVD, но это занимает много времени.

from sklearn.decomposition import TruncatedSVD
pca = TruncatedSVD()
pca.n_components = 10048
pca_data = pca.fit_transform(X_tr)
percentage_var_explained = pca.explained_variance_ / 
np.sum(pca.explained_variance_);cum_var_explained = np.cumsum(percentage_var_explained)

1 Ответ

0 голосов
/ 13 мая 2019

Вместо этого вы могли бы использовать следующее (если мы хотим сохранить 95% отклонения в данных, измените число по своему усмотрению):

from sklearn.decomposition import PCA
pca = PCA(n_components = 0.95)
reduced = pca.fit_transform(X)

Если я упускаю суть, дайте мне знать, где я не подключаюсь, я постараюсь помочь.

...