PySpark регрессия показывает нереалистичные c метрики - PullRequest
0 голосов
/ 07 января 2020

Я использую полиномиальную регрессию на PySpark стандартным способом

LR = LogisticRegression(featuresCol = 'features', labelCol = 'label', maxIter=some_iter)
LR_model = LR.fit(train_data)

Проблема в том, что я получаю точность в 1 $, и то же самое для положительного предсказанного значения. Даже если предположить, что я сильно перегрузил данные, как эти показатели могут быть такими?

...