Настройка параметра биномиальной логистической регрессии в pyspark; - PullRequest
0 голосов
/ 13 октября 2018

Я пытаюсь настроить параметр параметра Tuning Binomial Logistic Regression в pyspark, но результат не изменился вообще Параметры Fist

Вторые параметры

Первая модель логистической регрессии без параметров.

from pyspark.ml.classification import LogisticRegression

train_data, test_data = pipe_df.randomSplit([0.7,0.3])
print("Training Dataset Count: " + str(train_data.count()))
print("Test Dataset Count: " + str(test_data.count()))

# First Logistic regression model without parameters.
lr_model = LogisticRegression(featuresCol='features',labelCol='state')

lr_model = lr_model.fit(train_data)

results = lr_model.transform(test_data)
evaluator = MulticlassClassificationEvaluator(
    labelCol="state", predictionCol="prediction", metricName="accuracy")
print ("Test set accuracy = " + str(accuracy))

Точность

Точность тестового набора = 0,6401755241345685

Вторая модель логистической регрессии с новыми параметрами.

mlr = LogisticRegression(featuresCol='features',labelCol='state', maxIter=60, regParam=0.8, elasticNetParam=0.8, family="multinomial")

lrModel = mlr.fit(train_data)

results2 = lrModel.transform(test_data)
evaluator = MulticlassClassificationEvaluator(labelCol="state", predictionCol="prediction", metricName="accuracy")
accuracy = evaluator.evaluate(results2)
print ("Test set accuracy = " + str(accuracy))

Точность

Точность тестового набора = 0,6401755241345685

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...