Я использую логистическую регрессию PySpark, пытаясь отсортировать коэффициенты, чтобы я мог использовать наиболее важные функции в соответствии с ней.
В конвейере Ghe используются FeatureHasher и StandardScaler.Когда я пытаюсь отобразить имена объектов с помощью этого кода:
transformed = model.transform(TrainedData)
attrs = sorted(
(attr["idx"], attr["name"]) for attr in (chain(*transformed
.schema[lrm.summary.featuresCol]
.metadata["ml_attr"]["attrs"].values())))
vec = sorted([stage.coefficients for stage in model.stages if hasattr(stage,
"coefficients")])
, происходит сбой, потому что в схеме нет метаданных, поэтому происходит сбой:
KeyError: 'ml_attr'
Почему это так?Как я могу сделать функции <-> отображение коффе?