Я читаю эту книгу.Я использую Spark 2.4.0 в Scala 2.12 (автономный кластер с одной машиной)
На основе примера этой книги я написал этот код
val model = new RandomForestRegressor()
.setFeaturesCol("features")
.setLabelCol("label")
.setImpurity("gini")
.setMaxBins(20)
.setMaxDepth(20)
.setNumTrees(50)
Но я получаю ошибку
Exception in thread "main" java.lang.IllegalArgumentException:
rfr_dc9303ee1fc9 parameter impurity given invalid value gini.
[error] at org.apache.spark.ml.param.Param.validate(params.scala:78)
[error] at org.apache.spark.ml.param.ParamPair.<init>(params.scala:656)
[error] at org.apache.spark.ml.param.Param.$minus$greater(params.scala:87)
[error] at org.apache.spark.ml.param.Params.set(params.scala:737)
[error] at org.apache.spark.ml.param.Params.set$(params.scala:736)
[error] at org.apache.spark.ml.PipelineStage.set(Pipeline.scala:42)
Полный код по адресу: https://github.com/abhsrivastava/allstate/blob/master/src/main/scala/com/abhi/RandomForestRegression.scala