Как я могу измерить точность и отзыв на логистической регрессии с PySpark? - PullRequest
0 голосов
/ 14 апреля 2019

Я использую модель логистической регрессии в PySpark через блоки данных, но я не могу получить свою точность и вспомнить.Все работает нормально, и я могу получить свой ROC, но для Precision and Recall нет атрибута или lib

lrModel = LogisticRegression()

predictions = bestModel.transform(testData)

# Instantiate metrics object
results = predictions.select(['probability', 'label'])
results_collect = results.collect()
results_list = [(float(i[0][0]), 1.0-float(i[1])) for i in results_collect]
scoreAndLabels = sc.parallelize(results_list)

metrics = MulticlassMetrics(scoreAndLabels)

# Overall statistics
precision = metrics.precision()
recall = metrics.recall()
f1Score = metrics.fMeasure()
print("Summary Stats")
print("Precision = %s" % precision)
print("Recall = %s" % recall)
print("F1 Score = %s" % f1Score)

>>>Summary Stats
>>>Precision = 0.0
>>>Recall = 0.0
>>>F1 Score = 0.0
...