Из этого вопроса pyspark-mllib-random-forest-feature-importances Я вижу, что есть метод с именем featureImportances
, который возвращает SparseVector.
Вывод выглядит примерно так:
SparseVector(2, {0: 0.6, 1:0.4})
У меня вопрос, как связать имя столбца с исходным именем функции? Есть ли способ извлечь имена столбцов из объекта RandomForestClassifier?
РЕДАКТИРОВАТЬ: модель является вторым этапом конвейера. Первый этап - это объект VectorAssembler, используемый для определения входных столбцов для модели.