Я сейчас знакомлюсь с Pyspark
и SparkML
.Для этого я использую титанический набор данных, чтобы обучить GLM прогнозировать «Тариф» в этом наборе данных.
Я внимательно слежу за документацией Spark.Я получаю рабочую модель (которую я называю glm_fare
), но когда я пытаюсь оценить обученную модель, используя summary
, я получаю следующее сообщение об ошибке:
RuntimeError: сводка по обучению недоступна дляthis GeneralizedLinearRegressionModel
Почему это так?
Код для обучения был таким:
glm_fare = GeneralizedLinearRegression(
labelCol="Fare",
featuresCol="features",
predictionCol='prediction',
family='gamma',
link='log',
weightCol='wght',
maxIter=20
)
glm_fit = glm_fare.fit(training_df)
glm_fit.summary