pyspark сопоставляет имена объектов с коэффициентами - PullRequest
0 голосов
/ 20 декабря 2018

Я использую логистическую регрессию PySpark, пытаясь отсортировать коэффициенты, чтобы я мог использовать наиболее важные функции в соответствии с ней.

В конвейере Ghe используются FeatureHasher и StandardScaler.Когда я пытаюсь отобразить имена объектов с помощью этого кода:

transformed =  model.transform(TrainedData)
attrs = sorted(
(attr["idx"], attr["name"]) for attr in (chain(*transformed
    .schema[lrm.summary.featuresCol]
    .metadata["ml_attr"]["attrs"].values())))

vec = sorted([stage.coefficients for stage in model.stages if hasattr(stage, 
"coefficients")])

, происходит сбой, потому что в схеме нет метаданных, поэтому происходит сбой:

KeyError: 'ml_attr'

Почему это так?Как я могу сделать функции <-> отображение коффе?

...