Pyspark: как извлечь значимость читабельной функции из случайного леса spark-ml - PullRequest
0 голосов
/ 18 октября 2019

Из этого вопроса pyspark-mllib-random-forest-feature-importances Я вижу, что есть метод с именем featureImportances, который возвращает SparseVector.

Вывод выглядит примерно так:

SparseVector(2, {0: 0.6, 1:0.4}) 

У меня вопрос, как связать имя столбца с исходным именем функции? Есть ли способ извлечь имена столбцов из объекта RandomForestClassifier?

РЕДАКТИРОВАТЬ: модель является вторым этапом конвейера. Первый этап - это объект VectorAssembler, используемый для определения входных столбцов для модели.

...