Я использую логистическую регрессию в pyspark, используя версию spark: 2.1.2
Я знаю, что можно сохранить модель регрессии следующим образом:
# Initialise the logistic regression
model = LogisticRegression(featuresCol='features', labelCol='is_clickout',regParam=0, fitIntercept=False, family="binomial")
model = pipeline.fit(data)
# save model for future use
save_path = "model_0"
model.save(save_path)
Проблема в том, чтосохраненная модель не сохраняет сводку:
from pyspark.ml.classification import LogisticRegressionModel
model2 = LogisticRegressionModel.load(save_path)
model2.hasSummary ##### Returns FALSE
Я могу извлечь сводку следующим образом, но к ней не прикреплен метод сохранения: # Получить сводку по модели сводки = model.stages [-1].summary
Существует ли быстрый способ сохранить объект сводки?Для множественных регрессий?
В настоящее время я читаю все атрибуты объекта и сохраняю его как pandas df.