PySpark PCA: получить количество компонентов из объекта модели - PullRequest
0 голосов
/ 22 мая 2018

У меня есть подходящая модель PCA в PySpark, и мне нужно получить количество компонентов из объекта модели.

from pyspark.ml.feature import PCA
pca = PCA(k=5, inputCol='features', outputCol='components')
pca_model = pca.fit(data)

Я пытался использовать pca_model.k и pca_model.getParam('k'), но ни один из них не дает мне количество компонентов.

>>> pca_model.k
Param(parent='PCA_4e66a98132a4fe4ad86c', name='k', doc='the number of principal components (> 0)')
>>> pca_model.getParam('k')
Param(parent='PCA_4e66a98132a4fe4ad86c', name='k', doc='the number of principal components (> 0)')

Как получить количество компонентов из PySpark's PCAModel объект?

1 Ответ

0 голосов
/ 22 мая 2018

Вы можете использовать его модель Java:

pca_model._java_obj.getK()

или getOrDefault метод:

pca_model.getOrDefault("k")
...