Я пытаюсь настроить параметр параметра Tuning Binomial Logistic Regression в pyspark, но результат не изменился вообще Параметры Fist
Вторые параметры
Первая модель логистической регрессии без параметров.
from pyspark.ml.classification import LogisticRegression
train_data, test_data = pipe_df.randomSplit([0.7,0.3])
print("Training Dataset Count: " + str(train_data.count()))
print("Test Dataset Count: " + str(test_data.count()))
# First Logistic regression model without parameters.
lr_model = LogisticRegression(featuresCol='features',labelCol='state')
lr_model = lr_model.fit(train_data)
results = lr_model.transform(test_data)
evaluator = MulticlassClassificationEvaluator(
labelCol="state", predictionCol="prediction", metricName="accuracy")
print ("Test set accuracy = " + str(accuracy))
Точность
Точность тестового набора = 0,6401755241345685
Вторая модель логистической регрессии с новыми параметрами.
mlr = LogisticRegression(featuresCol='features',labelCol='state', maxIter=60, regParam=0.8, elasticNetParam=0.8, family="multinomial")
lrModel = mlr.fit(train_data)
results2 = lrModel.transform(test_data)
evaluator = MulticlassClassificationEvaluator(labelCol="state", predictionCol="prediction", metricName="accuracy")
accuracy = evaluator.evaluate(results2)
print ("Test set accuracy = " + str(accuracy))
Точность
Точность тестового набора = 0,6401755241345685