Я пытаюсь найти p-значения для коэффициентов для Spark 2.3. Логистическая регрессия.В частности, если я это сделаю:
lr = LogisticRegression(labelCol="clicks", featuresCol="features", maxIter=10,elasticNetParam=1)
# Train model with Training Data
lrModel = lr.fit(trainingData)
print(lrModel.coefficients) #get coefficients
вернет список значений коэффициента, но без значения p или доверительного интервала.Я не смог найти в документации (https://spark.apache.org/docs/latest/api/python/pyspark.ml.html), где можно найти p-значения для коэффициентов.
Similir Вопросы, которые не отвечают на то, что я ищу:
Как рассчитать p-значения в логистической регрессии Spark? (Это более старая версия Spark, и я не могу подтвердить, действительно ли она возвращает значение pvalue; также обратите внимание, что эта функция не принимает в конвейерах (например, один горячийкодирование трубопроводов и т. д.))