Я пытаюсь использовать gridSearch, чтобы найти лучшие гиперпараметры для модели.
Вот мой код:
var featuresList = Array("Age","Gender","Qualifications")
val assembler = new VectorAssembler().setInputCols(featuresList_RF).setOutputCol("features")
val randomForest = new RandomForestClassifier().setLabelCol("label").setFeaturesCol("features")
val pipeline_RF = new Pipeline().setStages(Array(assembler, randomForest))
val paramGrid_RF = new ParamGridBuilder().addGrid(randomForest.numTrees, Array(50, 100, 250, 500)).addGrid(randomForest.maxDepth, Array(5, 10, 15)).addGrid(randomForest.maxBins, Array(50, 100, 208)).addGrid(randomForest.minInstancesPerNode, Array(10, 50, 100)).build()
val RF = new CrossValidator().setEstimator(pipeline_RF).setEvaluator(new BinaryClassificationEvaluator).setEstimatorParamMaps(paramGrid_RF)
val model_RF = RF.fit(train)
Как я могу отобразить лучшие параметры, найденные CrossValidation? Если я хочу сделать отчет и объяснить параметры, которые я использовал в моем случайном лесу ...
Большое спасибо