Как извлечь лучший набор параметров из TrainValidationSplitModel в Java? - PullRequest
0 голосов
/ 20 февраля 2020

Я использую ParamGridBuilder для построения сетки параметров для поиска и TrainValidationSplit для определения лучшей модели (RandomForestClassifier) ​​в Java. Теперь я хочу знать, каковы параметры (maxDepth, numTrees) из ParamGridBuilder, который производит лучшую модель.

      Pipeline pipeline = new Pipeline().setStages(new PipelineStage[]{
          new VectorAssembler()
         .setInputCols(new String[]{"a", "b"}).setOutputCol("features"), 
          new RandomForestClassifier()
         .setLabelCol("label")
         .setFeaturesCol("features")});

      ParamMap[] paramGrid = new ParamGridBuilder()
            .addGrid(rf.maxDepth(), new int[]{10, 15})
            .addGrid(rf.numTrees(), new int[]{5, 10})
            .build();

      BinaryClassificationEvaluator evaluator = new BinaryClassificationEvaluator().setLabelCol("label");

      TrainValidationSplit trainValidationSplit = new TrainValidationSplit()
            .setEstimator(pipeline)
            .setEstimatorParamMaps(paramGrid)
            .setEvaluator(evaluator)
            .setTrainRatio(0.85);
      TrainValidationSplitModel model = trainValidationSplit.fit(dataLog);

      System.out.println("paramMap size: " + model.bestModel().paramMap().size());
      System.out.println("defaultParamMap size: " + model.bestModel().defaultParamMap().size());
      System.out.println("extractParamMap: " + model.bestModel().extractParamMap());
      System.out.println("explainParams: " + model.bestModel().explainParams());
      System.out.println("numTrees: " + model.bestModel().getParam("numTrees"))//NoSuchElementException: Param numTrees does not exist.

Эти попытки не помогают ...

paramMap size: 0
defaultParamMap size: 0
extractParamMap: {

}
explainParams: 

1 Ответ

0 голосов
/ 24 февраля 2020

Я нашел способ:

Pipeline bestModelPipeline = (Pipeline) model.bestModel().parent();
RandomForestClassifier bestRf = (RandomForestClassifier) bestModelPipeline.getStages()[1];

System.out.println("maxDepth : " + bestRf.getMaxDepth());
System.out.println("numTrees : " + bestRf.getNumTrees());
System.out.println("maxBins : " + bestRf.getMaxBins());
...